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m (54) Title: METHOD FOR THE EXPRESSION OF BIOSYNTHETIC GENES IN PLANT SEEDS USING NOVEL MULTIPLE 
s EXPRESSION CONSTRUCTS 



(54) Bezeichnung: VERFAHREN ZUR EXPRESSION VON BIOSYNTHESEGENEN IN PFLANZLICHEN SAMEN UNTER 
VERWENDUNG VON I^UEN MULTIPLEN EXPRESSIONSKONSTRUKTEN 

IS 

(57) Abstract: The invention relates to expression cassettes, combinations thereof and vectors containing said expression cassettes, 
containing plant promoters with an expression specificity for plant seeds, in particular linseed and the use of said expression cas- 
^ settes or vectors for the recombinant expression of heterologous genes in plants. The invention further relates to transgenic plants, 
^ transformed by means of said expression cassettes, or vectors, cultures, parts or transgenic propagations derived therefrom and the 
use of the above as foodstuff, animal feedslufl. seedstufT. pharmaceuticals, fine chemicals or industrial raw material. 

^ (57) Zusammenfessung: Die Brfindung betrifft Expressionskassetten, deren Kombination und Vektoren enthaltend die Expressi- 
2 onskassetten. die pflanzliche Promotoren mit einer ExpressionsspezifitMt fttr pflanzliche Samen insbesondere Leinsamen enthalten. 

sowie die Verwendung dieser Expressionskassetten oder Vektoren zur rekombinanten Expression heterologer Gene in Pflanzen. 
Q Die Erfindung bctrifit femcr mit dicsen Expressionskassetten oder Vektoren transformierte tiansgenc Pflanzen, davon abgelcitete 
^ Kulturen. Telle oder transgenes Vermehrungsgut. sowie die Verwendung derselben als Nahrungs-, Futtermittel oder Saatgut, Phar- 
^ mazeutika, Feinchemikalien oder als industrieller Grundstoff. 
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Verfahren zur Expression von Biosynthesegenen in pflanzlichen Sa- 
men imter Verwendung von neuen multiplen Expressionskonstrukten 

5 Beschreibiing 

Die Erfindung betrifft Expressionskassetten, deren Kombination 
und Vektoren enthaltend die Expressionskassetten, die pflanzliche 
Promotoren mit einer Expressionsspezif itat far pflanzliche Samen 

10 insbesondere Leinsamen enthalten, sowie die Verwendung dieser Ex- 
pressionskassetten Oder Vektoren zur rekombinanten Expression he- 
terologer Gene in Pflanzen. Die Erfindung betrifft ferner mit 
diesen Expressionskassetten oder Vektoren transf ormierte trans- 
gene Pflanzen, davon abgeleitete Kulturen, Telle oder transgenes 

15 Vermehrungsgut , sowie die Verwendung derselben als Nahrungs-, 
Futtermittel oder Saatgut, Pharmazeutika, Feinchemikalien oder 
als industrieller Grundstoff . 

Die erfindungsgemafien Expressionskassetten werden vorteilhaf t in 

20 einem Verfahren zur Herstellung von \mgesattigten Fettsauren mit 
mindestens zwei Doppelbindungen und/ oder ein Verfahren zur Her- 
stellung von Triglyceriden mit erhahtem Gehalt an mehrfach unge- 
sattigten Fettsauren mit mindestens zwei Doppelbindungen verwen- 
det. Im Verfahren finden vorteilhaf t die Nukleinsauresequenzen 

25 SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5 oder 11 Anwendung, die 
unter Verwendung der Expressionskassetten exprimiert werden. 
Diese vorgenannten NukleinsSuren sind im Verfahren sowie zur Her- 
stellung eines transgenen Organismuses bevorzugt einer transgenen 
Pflanze oder eines transgenen Mikroorganismus mit erhohtem Gehalt 

30 an Fettsauren, 6len oder Lipiden mit ungesSttigten Cis-, C20-. 

Oder C22-Fettsauren geeigriet. AulSerdem kannen mit Hilfe der erfin- 
dungsgemaSen Expressionskassetten weitere Gene neben den Nuklein- 
sauresequenzen SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5 und 
SEQ ID NO: 11 Oder seine Homologen, Derivate oder Analoga sowie 

35 Genkonstrukte, die diese Gene oder ihre Homologen, Derivate oder 
Analoga umfasst, sowie Ihre Verwendung allein oder in Kombination 
mit weiteren Biosynthesegenen bevorzugt Biosynthesegene fur poly- 
ungesattigter Fettsauren, wie vorteilhaf t in SEQ ID NO: 7 und SEQ 
ID NO: 9 dargestellt, in Organismen bevorzugt Pflanzen exprimiert 

40 werden. 

Eine Reihe von Produkten und Nebenprodukten natUrlich vor- 
kommender Stof fwechselprozesse in Mikroorganismen, tierischen 
und pflanzlichen Zellen sind far viele Indus triezweige, ein- 
45 schlieElich der Futtermittel-, Nahrungsmittel-, Kosmetik- und 
pharmazeutischen Industrie, niltzlich. Zu diesen gemeinsam als 
•Feinchemikalien" bezeichneten MolekUlen gehdren beispielsweise 
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Lipide und Fettsauren, unter denen eine beispielhaf te Klasse 
die mehrfach ungesSttigten PettsMuren sind. FettsSuren und Tri- 
glyceride haben eine Vielzahl von Anwendungen in der Lebens- 
mittelindustrie, der Tierem^rung, der Kosmetik und im Phantia-^ 
5 bereich. Je nachdem ob es sich \m freie gesSttigte Oder unge- 
sattigte FettsSuren oder mm Triglyceride iiiit einem erh5hten 
Gehalt an gesattigten oder ungesattigten FettsSuren handelt, sind 
sie fiir die unterschiedlichsten Anwendxingen geeignet, so werden 
beispielsweise mehrfach ungesattigte Fettsauren (polyunsaturated 
10 £atty acids, PUFAs) Babynahrung zur Erhohung des Nahrwertes 
zugesetzt. PUFAs haben weiterhin einen positiven Einfluss auf 
den Cholesterinspiegel im Blut von Menschen und eignen sich 
daher zum Schutz gegen Herzkrankheiten. So finden sie in ver- 
schiedenen diatischen Lebensmitteln oder Medikamenten Anwendung. 

15 

Besonders geeignete Mikroorganismen zur Herstellung von PUFAs 
sind Mikroorganismen wie Thraustochytrien oder Schizochytrien- 
St&rane/ Algen wie Phaeodactylum tricornutixm oder Crypthecodinium- 
Arten, Ciliaten, wie Stylonychia oder Colpidium, Pilze, wie 

20 Mortierella, Entomophthora oder Mucor. Durch Stammselektion 
ist eine Anzahl von Mutantenstammen der entsprechenden Mikro- 
organismen entwickelt worden, die eine Reihe wvinschenswerter 
Verbindungen, einschlie&lich PUFAs, produzieren. Die Selektion 
von StStamen mit verbesserter Produktion eines bestimmten Molektils 

25 ist jedoch ein zeitraubendes und schwieriges Verfahren, 

Alternativ kann die Produktion von Feinchemikalien geeigneter- 
weise ilber die Produktion von Pflanzen, die so entwickelt sind, 
dass sie die vorstehend genannten PUFAs herstellen, im grofien 

30 MaEstab durchgefiihrt werden. Besonders gxit ftir diesen Zweck 
geeignete Pflanzen sind Olfruchtpf lanzen, die groSe Mengen an 
Lipidverbindungen enthalten wie Raps, Canola, Lein, Soja, Sonnen- 
blumen, Borretsch und Nachtkerze. Aber auch andere Nutzpf lanzen, 
die Ole oder Lipide und Fettsauren enthalten, sind gut geeignet, 

35 wie in der eingehenden Beschreibung dieser Erfindung erwShnt. 
Mittels herkommlicher Ziichtung ist eine Reihe von Mutanten- 
pf lanzen entwickelt worden, die ein Spektrxm axi wUnschenswerten 
Lipiden und Fetts£luren; Cofaktoren und Enzymen produzieren. 
Die Selektion neuer Pf lanzensorten mit verbesserter Produktion 

40 eines bestimmten Moleklils ist jedoch ein zeitaufwSndiges und 
schwieriges Verfahren oder sogar xinmoglich, wenn die Verbindung 
in der entsprechenden Pflanze nicht nattirlich vorkommt, wie im 
Fall von mehrfach ungesSttigten Cie-, Cao-FettsSuren \ind C22-Fett' 
sauren und solchen mit ISngeren Kohlenstof fketten. 



45 
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Aufgrund der positiven Eigenschaf ten iingesattigter FettsSuren 
hat es in der Vergangenheit nicht an Ansatzen gefehlt. Gene, 
die an der Synthese von FettsSuren bzw. Triglyceriden beteiligt 
sind, fur die Herstellung von Olen in verschiedenen Organismen 
5 mit geandertem Gehalt an ungesattigten Fettsauren verfugbar 
2U machen. So wird in WO 91/13972 und seinem US-Aquivalent 
eine A-9-Desaturase beschrieben. In WO 93/11245 wird eine 
A-15-Desaturase in WO 94/11516 wird eine A-12-Desaturase bean- 
sprucht. A-6-Desaturasen werden in WO 93/06712, US 5,614,393, 

10 WO 96/21022 und WO 99/27111 beschrieben. Weitere Desaturasen 
werden beispielsweise in EP-A-0 550 162, WO 94/18337, 
WO 97/30582, WO 97/21340, WO 95/18222, EP-A~0 794 250, Stukey 
et al., J. Biol. Chem., 265, 1990: 20144-20149, Wada et al.. 
Nature 347, 1990: 200-203 oder Huang et al.. Lipids 34, 1999: 

15 649-659 beschrieben. In WO 96/13591 wird eine A-6-Palmitoyl- 
ACP-Desaturase beschrieben und beansprucht. Die biocheiaische 
Charakterisierung der verschiedenen Desaturasen ist jedoch bis- 
her nur \juiz\ireichend erfolgt, da die Enzyme als membrangebundene 
Proteine nur sehr schwer zu isolieren und charakterisieren sind 

20 (MciCeon et al.. Methods in Enzymol. 71, 1981: 12141-12147, 
Wang et al.. Plant Physiol. Biochem., 26, 1988: 777-792). 

In Hefen konnte sowohl eine Verschiebung des Fettsaurespektrums 
zu ungesattigten Fettsauren hin als auch eine Steigerung der 

25 Produktivitat nachgewiesen werden {siehe Huang et al., Lipids 34, 
1999: 649-659, Napier et al., Biochem. J., Vol. 330, 1998: 
611-614) . Die Expression der verschiedenen Desaturasen in trans- 
genen Pflanzen zeigte allerdings nicht den gewiinschten Erfolg. 
Eine Verschiebung des Fettsaurespektrum zu ungesattigten Fett- 

30 sSuren hin konnte gezeigt werden, gleichzeitig zeigte sich aber, 
dass die Syntheseleistung der transgenen Pflanzen stark nachliefi, 
das heist gegeniiber den Ausgangspflanzen konnten nur geringere 
Mengen an Olen isoliert werden. 

35 Weder in Hefen noch in Pflanzen werden natUrlicherweise mehr- 
fach ungesattigte C20- und/oder C22-FettsSuren mit mindestens 
zwei Doppelbindungen im Fettsauremolekai wie ArachidonsSure 
(ARA) und/oder Eicosapentaensaure (EPA) und/oder Docosahexaen- 
sSure (DHA) hergestellt. 

40 

Nach wie vor besteht daher ein groSer Bedarf an neuen Genen, 
die fiir Enzyme kodieren, die an der Biosynthese \ingesattigter 
Fettsauren beteiligt sind und es enadglichen, diese in einem 
technischen Mafistab herzustellen. Keines der bisher bekannten 
45 biotechnologischen Verfahren zur Herstellung von mehrfach 
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ungesSttigten Fetts^uren liefert die vorgenannten Fetts^uren 
in wirtschaf tlich nutzbaren Mengen. 

Bei der Expression von Genen in Pflanzen gibt es iramer wieder 
5 Probleme, dass heiiSt es koitimt durch die Expression nicht zur er- 
warteten Steigerung bei der Herstellung des gewOnschten Wertpro- 
dukts . 

Verschiedene Methoden zum Einschleusen von Genen in das Genom von 
10 Pflanzen sind bekannt (Halford NG, Shewry PR, Br. Med, Bull., 
2000; 56: 62-73). Ziel ist die Herstellung von Pflanzen mit vor- 
teilhaften, neuen Eigenschaften, zum Beispiel zur Steigerung der 
landwirtschaf tlichen Produktivitat , zur Qualitatssteigerxong bei 
Nahrungsmitteln oder zur Produktion bestimmter Cheitiikalien oder 
15 Pharmazeutika (Dunwell JM, J. Exp. Bot., 2000: 51 Spec No: 
487-96) . 

Eine Grundvoraussetzxing fiXr die transgene Expression bestimmter 
Gene ist die Bereitstellung pf lanzenspezif ischer Promotoren. Pro- 

20 motoren sind wichtige Werkzeuge in der Pf lanzenbiotechnologie, \m 
die Expression eines bestimmten Gens in einer transgenen Pflanze 
lokal und zeitlich zu steuem und so bestiminte Wesensmerkmale der 
Pflanze auszunutzen bzw. erst zu erzielen. Verschiedene Promoto- 
ren ftlr diverse Pf lanzenarten, bestimmte Pf lanzengewebe und Ent- 

25 wickl\ingsstadien sind bekannt. 

Verwendet werden zum Beispiel konstitutive Promoter en wie der 
Promoter der Nopalinsynthase aus Agrobacterium, der TR-Doppelpro- 
motor oder der Promoter des 35S-Transkriptes des Blumenkohlmo- 

30 saikvirus (CaMV) (Odell et al., Nature 1985: 313, 810--812) , der 
OCS (Octopin Synthase) Promoter aus Agrobacterium, der Ubiquitin 
Promotor (Holtorf S et al,, Plant Mel. Biol. 1995, 29:637-646), 
die Prometoren der vakuolarer ATPase Untereinheiten oder der Pro- 
motor eines prolinreichen Proteins aus Weizen (WO 91/13991) . 

35 Nachteilig bei diesen Prometoren ist, dass sie in fast alien Ge- 
weben der Pflanze konstitutiv aktiv sind. Eine gezielte Expres- 
sion von Genen in bestimmten Pf lanzenteilen oder zu bestimmten 
Entwicklungszeitpunkte'n ist mit diesen Prometoren nicht mSglich. 

40 Prometoren, deren Aktivitat gewebsspezif isch oder entwicklunsgab- 
hangig reguliert ist, wurden iseliert. SpezifitSten sind fiir die 
Antheren, Ovarien, Biaten, Blatter, Stengel, Wurzeln und Samen 
beschrieben. Die Stringenz der Spezifitat, als auch die Expres- 
sions aktivi tat dieser Prometoren ist sehr unterschiedlich. Zu 

45 nennen sind Prometoren, die eine blattspezif ische Expression ge- 
wahrleisten, wie der Promotor der cytosolischen FBPase aus Kar- 
toffel (WO 97/05900), der SSU Promotor (small subunit) der Rubi- 
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SCO (Ribulose-1, 5-bisphosphatcarboxylase) oder der ST-LSI Promo- 
tor aus Kartoffel (Stockhaus et al., EMBO J. 8 (1989), 2445 - 
245) . 

5 Weitere Promotoren sind beispielsweise spezif ische Promotoren fur 
Knollen, Speichervmrzeln oder Wurzeln, wie beispielsweise der Pa- 
tatin Promotor Klasse I (B33), der Promotor des Cathepsin D Inhi- 
bitors aus Kartoffel, der Promotor der Starke Synthase (GBSSl) 
Oder der Sporamin Promotor, fruchtspezif ische Promotoren, wie 

10 beispielsweise der fruchtspezif ische Promotor aus Tomate (EP-A 
409625), fruchtreifungspezif ische Promotoren, wie beispielsweise 
der fruchtreifungspezifische Promotor aus Tomate (WO 94/21794), 
bltitenspezifische Promotoren, wie beispielsweise der Phytoen-Syn- 
thase Promotor (WO 92/16635) oder der Promotor des P-rr Gens (WO 

15 98/22593) . 

Eine Variation der AktivitSt eines Promotoren anhcLngig vom Ent- 
wicklungs stadium der Pflanze wurd unter anderem von Baerson et 
al. beschrieben (Baerson SR, Lamppa GK. Plant Mol Biol. 
20 1993;22(2) :255-67) . 

Samenspezifische Promotoren sind aufgrund der Bedeutung des Sa- 
mens als eine der Hauptnahrungs- bzw. Futterquellen von Mensch 
\ind Tier \md als Produktionsort fur Wertstoffe von besonderen In- 

25 teresse. Bekannt sind Promotoren, die eine Expression in Samen 
und pflcinzlichen Embryonen steuem. So wurden beispielsweise die 
Promotoren von Genen identif iziert, die fUr Speicherproteine ver- 
schiedener Dicotyledonen kodieren. Samenspezifische Promotoren 
sind zum Beispiel der Promotor des Phaseolins (US 5504200, Bustos 

30 MM et al., Plant Cell- 1989;1 (9) :839-53) , des 2S Albximingens (Jo- 
seffson LG et al., J Biol Chem 1987, 262:12196-12201), des Legu- 
mins (Shirsat A et al., Mol Gen Genet. 1989;215 (2) :326-331) , des 
USP (unknown seed protein; Baumlein H et al., Molecular & General 
Genetics 1991, 225 (3) :459-67> des Napin Gens ( Stalberg K, et 

35 al., L. Planta 1996, 199:515-519), des Saccharosebindeproteins 
(WO 00/26388) oder der LeB4-Promotor (Baiamlein H et al., Mol Gen 
genet 1991, 225: 121-128). Diese steuem eine hohe samenspezifi- 
sche Expression von Speicherproteinen. 

40 Trotz der allgemeinen Annahme, dafi pflanzliche Promotoren von ei- 
ner Spezies auf die andere Ubertragbar sind und auch in artfrem- 
den Pflanzenspezies Shnliche AktivitSlten und Spezifitaten aufwei- 
sen, mehren sich Hinweise auf Einschrcuikungen von dieser TVnnahme. 
So zeigte es sich, dafi die H5he der transgenen Expression von he- 

45 terologen Genen unter Kontrolle dieser Promotoren, oft stark von 
der Art der Wirtspflahze abhSngig ist. Es wurde f estgestellt, 
dass die Expression nicht immer absolut zelltypspezif isch ist. 
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Unterschiede im Expressionsmuster iind der Expressionsstarke eines 
bestiinmten Promoters k6nnen durch tinterschiedliche Wirtspflanzen 
Oder durch unterschiedliche Insertionsorte in das Genom der 
Wirtspflanze bedingt sein {Goossens A et al.. Plant Phys 1999, 
5 120:1095-1104) . 

Durch eine Genexpression in anderen Pf lanzenteilen kann die Ver- 
wendimg eines Promoters in einer anderen Pflanzenart sehr einge- 
schrSnkt sein. Etwa wenn die Expression des Genes in den Metabo- 
10 lismus der Zelle, die Zusammensetzung der Membranlipide oder die 
Biosynthese eingreift. 

Es bestand daher die Aufgabe weitere Expressionskassetten fxlr die 
Expression in Pflanzen zur Verfiigung zu stellen. Und diese fxir 

15 die Expression von Genen vorteilhaft Biosynthesegenen allein oder 
gegebenenf alls in Kombination mit anderen Enzymen in einem 
Verfahren beispielsweise zur Herstellung mehrfach ungesattigter 
FettsSuren zu verwenden. Diese Aufgabe wurde durch die erfin- 
dungsgemaSen E3cpressionskassette mit einer Struktur ausgewShlt 

20 aus der Gruppe geldst: 

a) LI - Promoter - Strukturgen - L2, 

b) LI - Promoter - Strukturgen - L2 - Ll - Promoter - Struktur- 
25 gen - L2, 

c) LI - Promoter - Strukturgen - L2 - LI - Promoter - Struktur- 
gen - L2 - LI - Promoter - Strukturgen - L2, 

30 wobei Ll, L2, Promoter und Strukturgen die folgende Bedeutung 
hat: 

Ll =5 SEQ ID NO: 32 oder eine ^quivalente Restriktionsschnittstel- 
len enthaltende Sequenz, 

35 

L2 = unabhSngig voneinander SEQ ID NO: 33, 34 oder 35 oder Squi- 
valente Restriktionsschnittstellen enthaltende Sequenzen, 

Promoter = pflanzlicher Promoter 

40 

Strukturgen = eine in Pflanzen exprimierbare 
Nukleinscluresequenz . 

Vorteilhaft ist das Strukturgen ein Biosynthesegen, beevorzugt 
45 ist es ein Biosynthesegen des Lipid- oder FettscLurestef fwechsels, 
vorteilhaft ein pflanzliches Gen, In einer besonders vorteilhaf- 
ten Aus fiihrungs form ist das Strukturgen eine NukleinsSuresequenz, 
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die fiir Proteine ausgewahlt aus der Gnippe : 
Acyl-CoA-Dehydrogenase (n) , Acyl-ACP[= acyl carrier protein]- 
Desaturase(n) , Acyl-ACP-Thioesterase(n) , Fettsaure-Acyl-Transf e- 
rase(n), Fettsaure-Synthase{n) , Fettsaure-Hydroxylase (n) , Acetyl- 
5 Coenzym A-Carboxylase{n) , Acyl-Coenzym A-Oxidase (n) , Fettsaure- 
Desaturase (n) , Fettsaure-Acetylenasen, Lipoxygenase!!, Triacylgly- 
cerol-Lipasen, Allenoxid-Synthasen, Hydroperoxid-Lyasen oder 
FettsSure-Elongase (n) , kodiert , 

10 Ganz besonders bevorzugt ist das Stinikturgen eine NukleinsSurese- 
quenz ausgewahlt aus der Gruppe: 

a) einer Nukleinsfiuresequenz mit der in SEQ ID NO: 1, SEQ ID NO: 
3, SEQ ID NO: 5 oder SEQ ID NO: 11 darges tell ten Seguenz, 

15 

b) Nukleinsauresequenzen, die aufgrund des degenerierten geneti- 
schen Codes durch Riiclctibersetziing der in SEQ ID NO: 2, 

SEQ ID NO: 4, SEQ ID NO: 6 oder SEQ ID NO: 12 darges tell ten 
AminosSuresequenzen erhalten werden, 

20 

c) Derivate der in SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5 oder 
SEQ ID NO: 11 darges tell ten Nukleinsauresequenz , die fiir Po- 
lypeptide mit der in SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6 
Oder SEQ ID NO: 12 dargestellten Aitiinosauresequenzen codieren 

25 und mindestens 50 % Homologie auf Aminosaureebene aufweisen, 

ohne daE die enzymatische Wirkung der Polypeptide wesentlich 
reduziert ist. 

Unter einer aquivalente Restriktionsschnittstellen enthaltende 
30 Sequenz im Sinne der Erfindung sind Sequenzen zu verstehen, die 

Restriktionsschnittstellen enthalten, die fur den Aufbau multip- 

ler Expressionskassetten geeignet sind, das hei£t geeigneter 

Weise nicht im Strukturgen vorhanden sind oder im binfiren Vektor. 

Solche Restriktionsschnittstellen wie beispielhaft EcoRI, BamHI, 
35 Sad, PstI, Ncol, Ndel, Bgll, Bglll, Xhol, Xba vind weitere sind 

dem Fachmann bekeinnt und konnen einschlagigen Fachbuchem entnom- 

men werden. 

Die erfindxmgsgemaEen Expressionskassetten kSnnen fiir die E3Q>res- 
40 sion von Genen in wirtschaf tlich wichtigen Kulturpf lanzen wie 
beispielsweise Lein, fur die keine endogenen samenspezif ischen 
Promotoren bekannt waren, verwendet werden. Lein ist, wie die 
vorliegenden Arbeiten zeigten, ftir eine samenspezif ische Expres- 
sion von Genen besonders problematisch, da of f ensichtlich mehrere 
45 Promotoren, die vom Fachmann fiir samenspezif ische Expression in 
anderen Pf lanzen routinemaEig benutzt werden, in z.B, in anderen 
' Pf lanzen wie Lein nicht fiinktionieren, das heifit nicht zu einer 
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Trcuiskription bzw. letztlich zu einer Expression der mKNA des 
Strukturgens ftihrt. 

Verwendung der oben genannten erf indungsgemaSen Expressionskas- 
5 setten in einem Verfahren zur Herstellung von Fetts^ureestern mit 
einem erhohtem Gehalt an mehrfach iingesattigten Fettsauren mit 
mindestens zwei Doppelbindungen dadurch gekennzeichnet, daS man 
mindestens eine Nukleinsturesequenz ausgewahlt aus der Gruppe 

10 a) einer Nukleinsauresequenz mit der in SEQ ID NO: 1, 

SEQ ID NO: 3, SEQ ID NO: 5 oder SEQ ID NO: 11 darges tell ten 
Sequenz , 

b) NukleinsSuresequenzen, die aufgrxind des degenerierten 

15 genetischen Codes durch Rtlcktlbersetzung der in SEQ ID NO: 2, 

SEQ ID NO: 4, SEQ ID NO: 6 oder SEQ ID NO: 12 darges tellt en 
Aminosauresequenzen erhalten werden, 

c) Derivate der in SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5 
20 Oder SEQ ID NO: 11 dargestellten Nukleinsauresequenz, die 

fur Polypeptide mit der in SEQ ID NO: 2, SEQ ID NO: 4, 
SEQ ID NO: 6 oder SEQ ID NO: 12 dargestellten AminosSure- 
sequenzen codieren und mindestens 50 % Homologie auf Amino- 
saureebene aufweisen, ohne dass die enzymatische Wirkung 
25 der Polypeptide wesentlich reduziert ist, 

in einen Fettsaureester produzierenden Organismus einbringt, 
anzieht und die dem Organismus enthaltenden Fettsaureester iso- 
liert . 

30 -'J /■ 'j 

Bei den im Verfahren verwendeten NukleinsSuresequenzen handelt es 

sich urn isolierte Nukleinsauresequenzen, die fUr Polypeptide mit 

A-5-, A-6- Oder A-12-Desaturaseaktivitat codieren. | J 

35 Im Verfahren werden vorteilhaft Fettsaureester mit mehrfach unge- 
stattigten Cis~ , C2o~ und/ oder C22-Fettsauremolektllen mit 
mindestens zwei Doppelbindungen im Fettsaureester hergestellt. 
Bevorzugt enthalten diese FettseLuremolekiile drei, vier oder ftinf 
Doppelbindungen und filhren vorteilhaft zur Synthese von Arachi- 

40 donsSure (ARA) , Eicosapentaensaure (EPA) oder DocosahexaensSure 
(DHA). j J 

Die Fettsaureester mit mehrfach ungescLttigten Cis-/ ^20^ und/oder 
C22~FettsauremolekUlen konnen aus den Organismen, die ftlr die Her- 
45 stellung der Fettsaureester verwendet wurden^ in Form eines 5ls 
oder Lipids beispielsweise in Form von Verbindungen wie Sphingo- 
lipide, Phosphoglyceride, Lipide, Glycolipide, Phospholipide , 
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Mbnoacylglyceride, Diacylglyceride, Triacylglyceride oder 
sonstige Fettsaureester , die die mehrfach ungesattigten Fett- 
s5.uren mit mindestens zwei Doppelbindungen enthalten, isoliert 

. werden . 

5 

Als Organismus fur die Herstelliing im Verfahren kommen prinzipell 
alle prokaryontischen oder eurkaryontischen Organismen wie proka- 
ryontische oder eurkaryontische Mikroorganismen wie gram-positive 
Oder gram-negative Bakterien, Pilze, Hefen, Algeii/ Ciliaten, tie- 

10 rische oder pflanzliche Zellen, Tiere oder Pflanzen wie Moose , 
zweikeimbiattrige oder einkeimblattrige Pflanzen in Frage. Vor- 
teilhaft werden Organismen im erf indungsgemafien Verfahren verwen- 
det, die zu den 6l-produzierenden Organismen gehSren, das heifit 
die filr die Herstellung von Olen verwendet werden, wie Mikroorga- 

15 nismen wie Crypthecodinium, Thraiistochytrium, Phaeodactylum xind 
Mortierella, Entomophthora, Mucor, Crypthecodinium sowie andere 
Algen oder Pilze sowie Tiere oder Pflanzen, insbesondere Pflanzen 
bevorzugt Olfruchtpflanzen/ die grofie Mengen an Lipidverbindiingen 
enthalten, wie Sojabohne, Erdnuss, Raps, Canola, Sonnenblume , 

20 Safflor, Nachtkerze, Lein, Soja, Borretsch, BSiime (Olpalme, Ko- 
kosnuss) oder Feldfrtlchte/ wie Mais, Weizen, Roggen, Hafer, 
Triticale, Reis, Gerste, Baumwolle, Maniok, Pfeffer, Tagetes, So- 
lanaceen-Pf lanzen, wie Kartoffel, Tabak, Aubergine und Tomate, 
Vicia-Arten, Erbse, Alfalfa oder Buschpf lanzen (Kaffee, Kakao, 

25 Tee) , Salix-Arten, Baume {5lplame, KokosnuS) sowie ausdauernde 
Gr^ser und Futterf eldf rtichte . Besonders bevorzugte erfindungsge- 
maSe Pflanzen sind Olfruchtpflanzen, wie Soja, ErdnulS, Raps, Ca- 
nola, Lein, Nachtkerze, Sonnenblume, Safflor oder BSume {Olpalme, 
KokosnuiS) . 

30 

Das Verfahren beinhaltet entweder die Ztichtung eines geeigneten 
transgenen Organismus bzw. transgenen Mikro organismus oder die 
Ziichtung von transgenen Pf lanzenzellen, -geweben, -organen oder 
ganzen Pflanzen, umfassend die erf indungsgemafien Nukleotidsequen- 

35 zen der SEQ ID NO: 1, 3, 5 oder 11 gegebenenfalls in Verbindungen 
mit den in SEQ ID NO: 7 und/oder SEQ ID NO: 9 dargestellten Se- 
quenzen allein oder in Kombination mit Sequenzen von vorteilhaf ~ 
ten erf indungsgemafien Expressionskassetten in vorteilhaf ten Vek- 
toren mit SEQ ID NO: 13-17 oder ihre Homologen, Derivate oder 

40 Analoga oder ein Genkonstrukt, das die SEQ ID NO: 1, 3, 5 oder 11 
ggf . in Verbindung mit SEQ ID NO: 7 und/oder 9 oder ihre Homolo- 
gen, Derivate oder Analoga umfasst, oder einen* Vektor, der diese 
Sequenz oder das Genkonstrukt umfasst, welches die E3q>ression er- 
find\mgsgem^&er Nukleinsauremolekdle herbeifiihrt, so dass eine 

45 Feinchemikalie produziert wird. Bei einer bevorzugten Ausfiih- 
rxmgsform vimfasst das Verf adiren f erner den Schritt des Gewinnens 
einer Zelle, die eine solche erf indungsgemSfie NukleinsSuresequen- 
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zen enthait, wobei eine Zelle itiit einer Desaturasenukleinsaixrese- 
quenz, einem Genkonstrukt oder elnem Vektor, welche die 
Expression einer erf indiingsgemaSen Desaturasenukleinsfiure allein 
Oder in Kombination herbeiftlhren, transformiert wird. Bei einer 
5 weiteren bevorzugten Ausf(ihr\ingsf orm umfasst dieses Verfahren 
femer den Schritt des Gewinnens der Feincheinikalie aus der 
Kultur. Bei einer besonders bevorzugten Aus f(ihrungs form gehSrt 
die Zelle zur Ordnung der Ciliaten, zu Mikroorganismen, wie 
Pilzen, ' Oder zwxl Pf lanzenreich, insbesondere zu Olf ruchtpf lanzen, 
10 besonders bevorzugt sind Mikroorganismen oder Olfruchtpf lanzen 
beispielsweise Erdnuss, Raps, Canola, Lein, Soja, Saf flower 
(Distel) , Sonnenbliunen oder Borretsch. 

Unter transgen im Sinne der Erfindung ist zu verstehen, dafi die 
15 im Verfahren verwendeten NukleinsSuren oder die erfindungsgemSSen 
Expressionskassetten nicht an ihrer natOrlichen Stelle im Genom 
eines Organismus sind/ dabei kannen die Nukleinsauren homolog 
Oder heterolog exprimiert werden. Trsinsgen bedeutet aber auch/ 
dass die Nukleinsauren oder Expressionskassetten an ihrem natiir- 
20 lichen Platz im Genom eines Organismus sind, dass jedoch die Se- 
quenz gegenuber der naturlichen Sequenz verSndert wurde und/oder 
das die Regulationssequenzen, der natiirlichen Sequenzen verandert 
wurden. Bevorzugt ist luiter transgen die Expression der erfin- 
dungsgemafien Nukleinsauren an nicht natttrlicher Stelle im Genom 
25 zu verstehen, das heifit eine homologe oder bevorzugt heterologe 
Expression der Nukleinsauren liegt vor. Bevorzugte transgene Or- 
ganismen sind die oben genannten treuisgenen Pflanzen bevorzugt 
Olfruchtpf lanzen. 

30 Aus den im Verfahren hergestellten FettsSureestem lassen sich 
die enthaltenden mehrfach \ingesattigten FettsSuren beispielsweise 
iiber eine Alkalibehandlung wie wassrige KOH oder NaOH vorteilhaf t 
in Gegenwart eines Alkohols wie Methanol oder Ethanol freisetzen 
\md isolieren (iber beispielsweise Phasentrennung vxxd anschliefien- 

35 der AnscLuerxing (iber z.B. H2SO4. 

Die im Verfahren hergestellten FettsSureester fallen in Form von 
Olen, Lipiden und/oder FettsSiiren an, die mindestens zwei Doppel- 
bindungen in den FettsSuremolektllen bevorzugt drei, vier, fiinf 

40 Oder sechs Doppelbindungen enthalten. Auch sind Zusammensetzun- 
gen, die die genannten 01-,* Lipid- und/oder Fettsauren enthalten, 
sowie die Verwendung der file, Lipide und/oder Fettsauren oder der 
Zusammensetzungen in Futter, Nahrungsmitteln, Kosmetika oder 
Pharmazeutika ein weiterer Anwend\ingsm6glichkeit der vorgenannten 

45 Stoffe. 
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Ein weiterer Aspekt betrifft ein Verfahren zur Modulation der 
Produktion eines Molekllls durch einen Mikroorganismus . Diese Ver- 
fahren \amfassen das Zusammenbringen der Zelle mit einer Substanz, 
welche die erfindungsgemaSen Desaturaseaktivitat allein oder in 
5 Kombination oder die Desaturasenukleinsaureexpression moduliert, 
so dass eine zellassoziierte Aktivitat relativ zu der gleichen 
Aktivit&t in Abwesenheit der Siibstanz verandert wird. Bei einer 
bevorzugten Ausfiihrungsform wird/werden ein oder zwei Stoffwech- 
selweg(e) der Zelle fiir Lipide \md Fettsauren, Cofaktoren und En- 

10 zyme moduliert oder der Transport von Verbindungen iiber diese 
Membranen moduliert, so dass die Ausbeute oder die Rate der 
Produktion einer gewiinschten Feinchemikalie durch diesen Mikro- 
organismus verbessert ist. Die Substanz, welche die Desaturase- 
aktivitat moduliert, kann eine Substanz sein, welche die 

15 Desaturaseaktivitat oder Desaturasenukleins^ureexpression 
stimuliert oder die als Zwischenprodukt bei der FettsSurebio- 
synthese verwendet werden kann. Beispiele fiir Substanzen, welche 
die Desaturaseaktivitat oder Desaturasenukleinsaureexpression 
stimulieren, sind u.a. kleine Molekule, aktive Desaturasen sowie 

20 desatxurasenkodierende Nukleinsa\iren/ die in die Zelle eingebracht 
worden sind. Beispiele fiir Substanzen, welche die Desaturase- 
aktivitat oder -Expression heinmen, sind u,a. kleine MolekCile 
und Antisense- Desatxxrasenukleinsauremolekiile. 

25 Ein weiterer Aspekt betrifft ein Verfahren zur Modulation der 

Ausbeuten einer gewiinschten Verbindung aus einer Zelle, umfassend 
das Einbringen eines Wildtyp- oder Mutanten-Desatiirasegens, das 
entweder auf einem separaten Plasmid gehalten oder in das Genom 
der Wirtszelle integriert wird, in eine Zelle. Bei Integration in 

30 das Genom kann die Integration zufallsgemSS sein oder durch der- 
curtige Rekoitibination erfolgen, dass das native Gen durch die ein- 
gebrachte Kopie ersetzt wird, wodurch die Produktion der ge- 
wiinschten Verbindxing durch die Zelle moduliert wird, oder durch 
Verwendung eines Gens in trans, so dass das Gen init einer funk- 

35 tionellen Express ionseinheit, welche mindestens eine die Expres- 
sion eines Gens gewShrleistende Sequenz und mindestens eine die 
Polyadenylierung eines funktionell transkribierten Gens gewShr- 
leis tends Sequenz enthait, funktionell verbunden ist. 

40 Bei einer bevorzugten Form des Verfahrens sind die Ausbeuten 
modifiziert. Bei einer weiteren bevorzugten Ausfiihrungsform 
wird die gewQnschte Chemikalie vermehrt, wobei unerwQnschte 
storende Verbindungen vermindert werden kSnnen. Bei einer 
besonders bevorzugten Ausfiihrungsform ist die gewtinschte Fein- 

45 chemikalie ein Lipid oder eine FettsStire, ein Cofaktor oder ein 
Enzym. Bei besonders bevorzugten Ausfiihrungsform ist diese 
Chemikalie eine mehrfach ungesSttigte FettsSure. Starker bevor- 
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zugt ist sie ausgewShlt aus Arachidonsaure (ARA) , Eicosapentaen- 
sSLure (EPA) oder DocosahexaensStire (DHA) . 

Die vorliegende Erfindung stellt vorteilhaf te Multiexpressions- 
5 kassetten \xad Konstrukte zur multiparallelen saitienspezif ischen 
Expression von Genkombinationen in Pflanzen zur Verftigung. 

Diese konnen im oben beschriebenen Verfahren zur Expression von 
Genen, bevorzugt den in SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, 
10 SEQ ID NO: 7, SEQ ID NO: 9 oder SEQ ID NO: 11 beschriebenen, in 
Algen und Pilzen und Pflanzen, insbesondere Slfruchtpflanzen sind 
bevorzugte Organismen fur das Verfahren verwendet werden. 

Durch die Verwendung der erf indungsgemalSen Expressionskassetten 

15 kdnnen im Verfahren in Verbindung mit den oben genannten Nuklein- 
sSuremolektile zur gentechnologisch Ver&iderung von Pflanzen ver- 
wendet werden, so dass sie schliefilich zur Herstellung von besse- 
ren oder ef f izienteren Produzenten einer oder mehrerer Feinchemi- 
kalien filhren. Diese verbesserte Produktion oder Effizienz der 

20 Produktion einer Feinchemikalie kann durch eine direkte Wirkung 
der Manipulation eines erf indungsgemalSen Gens oder durch eine in- 
direkte Wirkung dieser Manipulation hervorgerufen werden, Unter 
Feinchemikalien sind im Sinne der Erfindung beispielsweise Fett- 
saureester, die mehrfach ungesSttigte Fettsauren mit mindestens 

25 zwei Doppelbindungen enthalten wie Sphingolipide, Phosphoglyce- 
ride, Lipide, Glycolipide, Phospholipide, Monoacylglyceride , Dia~ 
cylglyceride, Triacylglyceride oder sonstige FettsMureester , die 
die mehrfach ungesfittigten Fettsauren mit mindestens zwei Doppel- 
bindungen enthalten, zu verstehen. Weiter sind darunter zu ver- 

30 stehen Verbindungen wie Vitamine beispielsweise Vitamin E, Vita- 
min C, Vitamin B2, Vitamin B6, Pantolacton, Carotinoide wie Asta- 
xanthin, P-Carotin, Zecixanthin und amdere. 

Moose und Algen sind die einzigen bekannten Pf lanzensysteme, 
35 die erhebliche Mengen an mehrfach ungesSttigten Fettsauren, wie 
Arachidonsaure (ARA) und/ oder Eicosapentaensfiure (EPA) und/oder 
DocosahexaensSure (DHA) herstellen. Moose enthalten PUFAs in 
Membranlipiden w^hr end Algen, algenverwandte Organismen und 
einige Pilze auch nennenswerte Mengen an PUFAs in der Triacyl- 
40 glycerolfraktion akkumulieren. Daher eignen sich NukleinsSure- 
molektile, die aus solchen StSmmen isoliert werden, die PUFAs auch 
in der Triacylglycerolfraktion akkumulieren, besonders vorteil- 
haft zur Modifikation des Lipid- und PUFA-Produktionssystems in 
einem Wirt, insbesondere in Mikroorgcoiismen, wie den vorstehend 
45 erwShnten Mikr ©organismen, \md Pflanzen, wie filfruchtpf lanzen, 
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beispielsweise Raps, Canola, Lein, Soja, Sonnenblumen, Borretsch. 
Sie sind deshalb vorteilhaft im Verfahren verwendbar. 



Die im Verfahren iinter Verwendung der erf indungsgemaSen Expres- 
5 sionskassetten verwendeten NukleinsMuresequenzen codieren fiir 
Desaturasen, die zur Produktion langkettiger mehrfach unge- 
sILttigter FettsSuren, vorzugsweise mit mehr als sechzehn, 
achtzehn oder zwanzig Kohlenstof fatomen im Kohlenstof fgrundgeriist 
der Fettsaure und/oder mindestens zwei Doppelbindungen in der 

10 Kohlenstof fkette, geeignet sind, wobei eine NukleinsSure fiir ein 
Enzym codiert, das Doppelbindungen in die A-5-Position, in einem 
anderen Fall in die A~6 -Position und in einem weiteren Fall in 
die A-12-Position einfuhren kann, Mithilfe dieser NukleinsSuren 
konnen hohe Mengen an PUFAs in der Triacylgycerolfraktion erhal- 

15 ten werden. Weiterhin wurden weitere Desaturasen isoliert, die 
allein oder zusammen mit einer A-4-Desaturase ftir ein Verfahren 
zur Produktion polyungesattigter Fettsauren genutzt werden kon- 
nen. Dabei ist in der Anmeldung unter-dem Singular d.h. unter ei- 
nem Desaturasegen oder -Protein auch der Plural d.h. die Desatu- 

20 rasegenen oder -Proteinen zu verstehen. 

Die Herstellung einer Triensaure mit Cis-Kohlenstof f kette mit- 
hilfe von Desaturasen konnte bisher gezeigt werden. In diesen 
literaturbekannten Verfahren wurde die Herstellung von y-Linolen- 
25 saure beansprucht. Bisher konnte jedoch niemand die Herstellung 
sehr langkettiger mehrfach \ingesattigter FettsSuren (mit C20- "^nd ' 
langerer Kohlenstof fkette sowie von Triensauren und hoher unge- 
sattigten Typen) allein durch modifizierte Organismen zeigen. 

30 Zur Herstellung der erf indungsgemSSen langkettiger PUFAs miissen 
die mehrfach xingesattigten Cie-Fettsauren zunachst durch die 
enzymatische Aktivitat einer Elongase urn mindestens zwei Kohlen- 
stof fatome verlSngert werden. Nach einer Elongationsrunde fiihrt 
diese EnzymaktivitSt zu C2o-Fettsauren, und nach zwei, drei und 

35 vier Elongationsrunden zu C22-f C24- oder C26-Fettsauren. Die in 
dieser Erfindung offenbarten Nukleinsauresequenzen, die fiir ver- 
schiedene Desaturasen codieren, konnen im Konzert mit Elongasen 
zu sehr langkettigen, polyungesSttigten fiihren. Die Aktivitat 
der erfindungsgemafien Desaturasen fOhrt vorzugsweise zu Cis-/ C20- 

40 und/oder C22-Fettsauren mit mindestens zwei Doppelbindungen im 
Fettsauremolektll, vorzugsweise mit drei, vier, ftof oder sechs 
Doppelbindungen, besonders bevorzugt zu Cia^ und/oder C20-Fett- 
sauren mit mindestens zwei Doppelbindungen im Fettsauremolekiil, 
vorzugsweise mit drei, vier oder fiinf Doppelbindungen im Molekiil. 

45 Die Fettsaureelongation kaim durch Kombination der erf ind\ingsge- 
mafien Desaturasen mit einer Elongaseciktivltat erfolgen, wobei die 
durch die in SEQ ID NO: 9 codierte Elongase vorteilhaft verwendet 
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werden kaiin, Nachdem die VerlHngeirung mit dem erf indungsgemaSen 
Enzyin(en) stattgefunden hat, kGnnen weitere Desaturierungs- 
schritte wie z.B. eine solche in A-5-Position erfolgen. Auch die 
Kombination mit anderen Elongasen wie solche, die zu einer Ver- 
5 langemng von Cis* auf C20- oder von C20" a^f C22-24 Ketten wie in 
WO0012720 of fenbart fahrt, kann Verwendung fitiden und/oder einer 
Desaturase mit Aktivitat filr A-4-Position kann vorteilhaft ein- 
gesetzt werden, um die hoch desaturierten Fetts^uren zu erhalten. 
Daher fOhren die Produkte der Desaturaseaktivitaten und der 

10 mSglichen weiteren Desaturierung zu bevorzugten PUFAs mit einem 
hoheren Desaturieanongsgrad, wie Dihomo-gamma-LonolensSure, 
Docosadiensaure, Arachidonsaure , coS-Eicosatriendihomo-y-linolen- 
sSure , Eicosapentaensaure , 0)3 -Eicosa triensSure , 0)3 -Eicosate traen- 
saure, DocosapentaensSure oder Docosahexaensaure , Substrate der 

15 erf indungsgemSfien EnzymaktivitSt sind z\m Beispiel TaxolsSure; 
6,9-Octadecadiensaure, Linolsaure, PinolensSure, a-oder y-Linolen- 
sSure oder StearidonsSure sowie ArachidonsMure, Eicosatetraen- 
saure, DocosapentaensSure, EicosapentaensSure . Bevorzugte Sub- 
strate sind LinolsSure, y-Linolensaure und/oder a-Linol ens Sure 

20 sowie ArachidonsSure, Eicosate traensMure, Docosapentaens&ure , 
Eicosapentaensaure, Besonders bevorzugt als Produkte des 
erf indungsgemSSen Verfahrens sind Arachidonsaure, Docosapentaen- 
sSure, Eicosapentaensaure. Die Cia-Fettsauren mit mindestens zwei 
Doppelbindungen in der FettsSure kSnnen durch die erfindungs- 

25 gemSfie enzymatische Aktivitat in Form der freien Fettsaure oder 
in Form der Ester, wie Phospholipide, Glycolipide, Sphingolipide, 
Phosphoglyceride, Monoacylglyceride, Diacylglyceride oder Tri- 
acylglyceride, verlSngert werden. 

30 Fiir die menschliche EmShrung ist konjugierte Linolsaure ^'CLA" 
von besonderer Bedeutung. Unter CLA versteht man insbesondere 
Fettsauren wie C18:2 » c^s* ntrana oder das Isomer C18:2 lotrans, 12 cis, 
die aufgrund menschlicher Enzymsysteme nach Aufnahme im Korper 
desaturiert bzw. elongiert werden konnen und zu gesundheits- 

35 fordernden Effekten beitragen kfinnen, Mit den erfindungsgemaBen 
Desaturasen { A-12-Desaturase) k5nnen auch solche konjugierten 
Fettsauren mit wenigstens zwei Doppelbindungen im Molekiil 
desaturiert werden und. damit solche gesundheitsf drdemden 
Fettsauren der menschlichen Ernahrung zugefiihrt werden. Weitere 

40 Beispiel fiir konjugierte Fettsauren sind alpha-Par inarsaure, 
Punicasaure, Eleostearinsaure und Calendulasaure . 

Unter der Verwendung von der erf indungsgemaSen Expressionkasset- 
ten in Klonierungsvektoren in Pflanzen und bei der Pf lanzentrans- 
45 formation, wie denjenigen, die ver6f fentlicht sind in xand dort 
zitiert sind: Plant Molecular Biology and Biotechnology (CRC 
Press, Boca Raton, Florida), Kapitel 6/7, S. 71-119 (1993); F.F. 
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White, Vectors for Gene Transfer in Higher Plants; in; Transgenic 
Plants, Bd. 1, Engineering and Utilization, Hrsgb. : Kirng und R. 
Wu, Academic Press, 1993, 15-38; B. Jenes et al., Techniques for 
Gene Transfer, in: Transgenic Plants, Bd. 1, Engineering and Uti- 
5 lization, Hrsgb.: Kung und R. Wu, Academic Press (1993), 128-143; 
Potrykus, Annu. Rev. Plant Physiol. Plant Molec. Biol, 42 (1991), 
205-225) ) , lassen sich Gene vorteilhaf t Biosynthesegene wie 
die oben beschriebenen NukleinsSuren 2ur gentechnologischen Ver- 
Snderung eines breiten Spektrums an Pflanzen verwenden, so dass 

10 diese ein besserer oder ef f izienterer Produzent beispielsweise 
eines oder mehrerer von Lipiden hergeleiteter Produkte, wie PU- 
FAs, werden. Diese verbesserte Produktion oder Effizienz der Pro- 
duktion eines beispielsweise von Lipiden hergeleiteten Produktes, 
wie PUFAs, kann durch direkte Wirkung der Manipulation oder eine 

15 indirekte Wirkung dieser Manipulation hervorgeruf en werden. 



Es gibt eine Reihe von Mechanismen, durch die die Veranderung 
eines erf indungsgemaSen Desaturaseproteins die Ausbeute, 
Produktion und/ oder Effizienz der Produktion einer Fein- 

20 chemikalie aus einer Olfruchtpflanze oder einem Mikroorganismus 
aufgrund eines ver&iderten Proteins direkt beeinflussen kann. 
Die Anzahl oder Aktivitat des Desaturaseproteins oder -Gens 
sowie von Genkorobinationen von Desaturasen und Elongasen kann 
erhoht sein, so dass gr5£ere Mengen dieser Verbindungen de 

25 novo hergestellt werden, well den Organismen diese Aktivitat 
und FShigkeit zur Biosynthese vor dem Einbringen des ent~ 
sprechenden Gens fehlte. Entsprechendes gilt tiir die Koiobination 
mit weiteren Desaturasen oder Elongasen oder weiteren Enzymen 
aus dem Lipids toffwechsel. Auch die Verwendung verschiedener 

30 divergenter/ d.h. auf DNA-Sequenzebene unterschiedlicher 
Seguenzen kann dabei vorteilhaft sein bzw, die Verwendung 
von Promotoren zur Genexpression, die eine andere zeitliche 
Genexpression z.B, abhSngig vom Reifegrad eines Samens oder 
5l-speichernden Gewebes ermSglicht. 

35 

Durch das Einbringen eines Desaturasegens oder mehrerer Desatura- 
segene unter Kontrolle der erfindungsgemSSen Expressionskassetten 
in einen Organismus allein oder in Kombination mit anderen Genen 
in eine Zelle kann nicht nur deu Biosynthesef luss zum Endprodukt 

40 erhOht, sondem auch die entsprechende Zusammensetzung der Enpro- 
dukte beispielsweise der Triacylglycerine erh5ht oder de novo ge- 
schaffen werden. Ebenso kann die Anzahl oder AktivitMt anderer 
Gene, die am Import von Nahrstoffen, die zur Biosynthese einer 
Oder mehrerer Feinchemikalien Iz.B. Fettsauren, polaren und neu- 

45 tralen Lipiden) ndtig sind, erhSht sein, so dass die Konzentra- 
tion dieser Vorlaufer, Cofaktoren oder Zwischenverbindungen in- 
nerhalb der Zellen oder innerhalb des Speicherkompartiments er- 
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hSht ist, wodurfch' die FShigkeit der Zellen zur Produktion von PU- 
FAs, wie im folgenden beschrieben, weiter gesteigert wird. Fett- 
sSuren und Lipide sind selbst als Feinchemikalien wiinschenswer t ; 
durch Optimierung der AktivitSt oder Erhohung der Anzahl einer 
5 Oder mehrerer Desaturasen, die an der Biosynthese dieser Verbin- 
d\ingen beteiligt sind, oder durch Zerstttren der Aktivitat einer 
Oder mehrerer Desaturasen, die am Abbau dieser Verbindungen be- 
teiligt sind, kann es moglich sein, die Ausbeute, Produktion und/ 
Oder Effizienz der Produktion von FettsSure- und Lipidmolekaien 
10 aus Pflanzen oder Mikroorganismen zu steigern. 

Die Mutagenese der/des erf indungsgemaEen Desaturasegene (s) kann 
weiterhin zu einem Desaturaseprotein mit ge^nderten Aktivitaten 
fiihren, welche die Produktion einer oder mehrerer gewiinschter 

15 Feinchemikalien direkt oder indirekt beeinf lussen. Beispiels- 
weise kann die Anzahl oder Aktivitat der/des erfindungsgemSEen 
Desaturasegens (e) gesteigert werden, so dass die normalen Stoff- 
wechselabfaile oder -nebenprodukte der Zelle (der en Menge m5g- 
licherweise aufgrund der Uberprodxiktion der gevKinschten Fein- 

20 chemikalie erhoht ist) effizient exportiert werden, bevor sie 
andere Molekiile oder Prozesse innerhalb der Zelle (welche die 
Lebensfahigkeit der Zelle senken wiirden) zerstdren oder die Bio- 
synthesewege der Feinchemikalie st5ren wiirden (wodurch die Aus- 
beute, Produktion oder Effizienz der Produktion der gewiinschten 

25 Feinchemikalie verringert wird) . Ferner kSnnen die relativ groSen 
intrazellularen Mengen der gewiinschten Feinchemikalie selbst 
toxisch fiir die Zelle sein oder Enzym-Riickkopplungsmechanismen, 
wie die allosterische Regulation, storen, beispielsweise konnte 
sie durch Steigerung der Aktivitat oder TVnzahl auiderer strom- 

30 aJDwarts folgender Enzyme oder Entgif tungsenzyme des PUFA-Wegs 
die Allokation der PUFA in die Triacylgylcerin-Fraktion steigern, 
man kdnnte die Lebensf ahigkeit von Saat zellen erh6hen, was 
wiederum zu besserer Entwicklung von Zellen in Kultur oder zu 
Saaten ftihrt, die die gewiinschte Feinchemikalie produzieren. 

35 Das erf indungsgema£e Desaturasegen kaxm auch so manipuliert 

werden, dass die entsprechenden Mengen der verschiedenen Lipid- 
und Fettsauremolekille hergestellt werden. Dies kann eine ein- 
schneidende Wirkung auf die Lipidzusammensetzung der Membrcoi 
der Zelle haben und erzeugt neue 5le zusatzlich zum Auf treten 

40 neusynthetisierter PUFAs. Da jeder Lipidtyp unterschiedliche 
physikalische Eigenschaften hat, kann eine VerSnderung der 
Lipidzusammensetzung einer Membran die Membranfluiditat erheb- 
lich verandern. Jinderungen der Membranfluiditat kSnnen sich 
auf den Transport von Moleldilen iiber die Membran sowie auf die 

45 Unversehrtheit der Zelle auswirken, die beide eine entscheidende 
Wirkung auf die Produktion von Feinchemikalien besitzen. In 
Pflanzen k5nnen diese Jinderungen tiberdies auch andere Merk- 
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male, wie Toleranz gegeniiber abiotischen und biotischen Stress- 
si tuationen, beeinflussen. 

Im Verfahren konnen isolierte Nukleinsauremolekiile (z.B. cDNAs) , 
5 liinfassend Nukleotidsequenzen, die eine Desaturase oder mehrere 
Desaturasen oder biologisch aktive Telle davon codieren, oder Nu- 
kleinsSurefragmente, die sich als Primer oder Hybridisierungs son- 
den zum Nachweis oder zur Amplifikation desaturasekodierender 
Nukleinsauren (z.B. DNA oder mRNA) eignen, verwendet werden. Bei 

10 besonders bevorzugten Ausfiihriingsformen umfasst das Nukleinsaure- 
molektil eine der in Sequenz ID N0:1 bzw 3 und 5 dargestellten Nu- 
kleotidsequenzen oder die kodierende Region oder ein Komplement 
einer dieser Nukleotidsequenzen. Bei anderen besonders bevorzug- 
ten Ausfiihxungsf ormen vunfasst das isolierte Nukleinsauremolekiil 

15 eine Nukleotidsequenz, die an eine Nukleotidsequenz , wie in der 
Sequenz SEQ ID NO: 1, 3, 5 oder 11 dargestellt, oder einen Teil 
davon hybridisiert oder zu mindestens etwa 50 %, vorzugsweise 
mindestens etwa 60 %, starker bevorzugt mindestens etwa 70 
80 % oder 90 % und noch stSrker bevorzugt mindestens etwa 95 %, 

20 96 %, 97 %, 98 %, 99 % oder mehr homolog dazu ist. Bei anderen 
bevorzugten Ausftttirungsformen kodiert das isolierte Nukleinsaure- 
molekiil eine der in der Sequenz SEQ ID NO: 2, A, 6 oder 12 darge- 
stellten Aminosauresequenzen. Das bevorzugte Desaturasegen be- 
sitzt vorzugsweise auch mindestens eine der hier beschriebenen 

25 Desaturaseaktivitaten. 

Bei einer weiteren Ausfiihrungsf orm kodiert das isolierte 
Nukleinsauremolekiil ein Protein oder einen Teil davon, wobei 
das Protein oder der Teil davon eine AminossLuresequenz enthait, 

30 die ausreichend homolog zu einer AminosSuresequenz der Sequenz 
SEQ ID NO: 2, 4, 6 oder 12 ist, dass das Protein oder der Teil 
davon eine DesaturaseaktivitSt beibeMlt. Vorzugsweise behalt das 
Protein oder der Teil davon, das /der von dem Nukleinsauremolekiil 
kodiert wird, die FShigkeit, am Stoffwechsel von zum Aufbau 

35 von Zellmembranen von Pflanzen notwendigen Verbindungen oder 
am Transport von Molekiilen iiber diese Membranen teilzunehmen. 
Bei einer Ausfiihrungsfom ist das von dem Nukleinsauremolekiil 
kodierte Protein zu mindestens etwa 50 %, vorzugsweise mindestens 
etwa 60 % und starker bevorzugt mindestens etwa 70 %, 80 % oder 

40 90 % \md am stSrksten bevorzugt mindestens etwa 95 %, 96 %, 97 %, 
98 %/ 99 % oder mehr homolog zu einer Aminosauresequenz der 
Sequenz SEQ ID NO: 2, 4, 6 oder 12. Bei einer weiteren bevor- 
zugten Ausfiihrungsf orm ist das Protein ein Volliangen-Protein, 
das im wesentlichen in Teilen homolog zu einer gesamten Amino- 

45 sauresequenz der SEQ ID NO: 2, 4, 6 oder 12 (die von dem in 
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SEQ ID NO: 1, 3, 5 Oder 11 gezeigten offenen Leserahmen herrtihrt) 
ist . 

Bei anderen Ausfiihrungsf ormen umfasst die isolierte Desaturase 
5 eine Aitiinosauresequenz ^ die zu mindestens etwa 50 % homolog zu 
einer der AminosSuresequenzen der SEQ ID NO: 2, A, 6 oder 12 ist 
und am Stof fwechsel von zuiti Aufbau von Fettsauren in einem Mikro- 
organismus oder einer Pflanzenzelle notwendigen Verbindungen oder 
am Transport von Molekvilen liber diese Membranen teilnehmen kann, 
10 wobei desaturierte Cib" oder C2o-22-Kohlenstoffketten mit Doppel- 
bindungen an mindestens zwei Stellen gemeint ist. 

Bei einer anderen bevorzugten Ausfiihrungsf orm riihrt das isolierte 
Nukleinsauremolekiil von Phaeodactyliam tricornutum UTEX646 her 
.15 und kodiert ein Protein (z.B. ein Desaturasefusionsprotein) , 

das eine biologisch aktive DomSne enthSlt, die zu mindestens etwa 
50 % Oder mehr homolog zu einer AminosSuresecjuenz der Sequenz 
SEQ ID NR 2, 4, 6 oder 12 ist und die Ffihigkeit, am Stof fwechsel 
von z\am Aufbau von Zellmembranen von Pf lanzen notwendigen Ver- 

20 bindungen oder am Transport von Molektilen \iber diese Membrcinen 
teilzunehmen, beibehalt oder zumindest eine der Desaturierungs- 
aktivitaten resultierend in PUFAs wie GLA, ALA, Dihomo-gamma 
Linolensaure , ARA, EPA oder DHA oder deren Vorl^uf ermolekiile 
besitzt, und umfasst auch heterologe Nukleinscluresequenzen, die 

25 ein heterologes Polypeptid oder regulatorische Proteine kodieren. 

Alternativ kann die isolierte Desaturase eine Aminosauresequenz 
xjmfassen, die von einer Nukleotidsequenz kodiert wird, die an 
eine Nukleotidsequenz der SEQ ID NO: 1, 3/ 5 oder 11 hybridi- 

30 siert, z.B. unter stringenten Bedingungen hybridisiert , oder zu 
mindestens etwa 50 %, vorzugsweise mindestens etwa 60 starker 
bevorzugt mindestens etwa 70 %, 80 % oder 90 % und noch starker 
bevorzugt mindestens etwa 95 %, 96 %, 97 %, 98 99 % oder mehr 
homolog dazu ist. Es ist ebenfalls bevorzugt, dass die bevor- 

35 zugten Desaturasef ormen ebenfalls eine der hier beschriebenen 
Desaturaseaktivitaten besitzen. 

Bei einer anderen Ausfdhrungsform ist das isolierte NukleinscLure- 
molekai mindestens 15, 25, 50, 100, 250 oder mehr Nukleotide lang 

40 und hybridisiert \mter stringenten Bedingungen an ein Nuklein- 
sauremolekUl, das eine Nukleotidsequenz der SEQ ID NO: 1, 3, 5 
oder 17 umfasst, Vorzugsweise entspricht das isolierte Nuklein- 
s^uremolekUl einem nattlrlich vorkommenden NukleinsSuremolekai . 
Stclrker bevorzugt kodiert das isolierte NukleinsSLuremolekUl 

45 nattlrlich vorkommende Phaeodactylxam-Desaturase oder einen 
biologisch aktiven Teil davon. 
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Eine weitere Ausfuhr\mgsform der Erfindiing sind Expressions- 
kassetten, die die Expression der erfindungsgemaEen Nukleinsauren 
mit den Sequenzen SEQ ID NO: 1, 3, 5 oder 11 in den verschiedenen 
Organismen wie pf lanzliche Zellen, Geweben, Teilen von Pflanzen 
5 Oder ganzen Pflanzen ermoglichen. 



Unter der erf indungsgemSSen Expressionskassette (= Nukleins^ure- 
konstrukt oder -fragment) sind die in SEQ ID NO: 32 als LI und 
einem Promoter, einem Strukturgen ausgewahlt aus den vorteilhaf- 

10 ten Sequenzen SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5 oder 
SEQ ID NO: 11, die sich als Ergebnis des genetischen Codes und/ 
oder deren funktionellen oder nicht funktionellen Derivate zu 
verstehen, und die Polylinder-Tentiinator-Polylinker-Sequenzen ( = 
L2) SEQ ID NO: 33, SEQ ID NO: 34 oder SEQ ID NO: 35 zu verstehen. 

15 Diese steuern vorteilhaf teirweise die Genexpression in der Wirts- 
zelle. Diese in den Konstrukten enthaltenen regulatorischen Se- 
quenzen sollen die gezielte Expression der Gene und der Protei- 
nexpression ermoglichen. Dies kann beispielsweise je nach Wirts- 
organismus bedeuten, dass das Gen erst nach Induktion exprimiert 

20 und/oder iiberexprimiert wird, oder dass es sofort esqjrimiert und/ 
Oder viberexprimiert wird. Beispielsweise handelt es sich bei die- 
sen regulatorischen Sequenzen um Sequenzen an die Induktoren Oder 
Repressoren binden und so die Expression der Nukleins&ure regu- 
lieren. ZusStzlich zu di esen neuen Regulationssequenzen oder an- 

25 stelle dieser Sequenzen kann die natiirliche Regulation dieser Se- 
quenzen vor den eigentlichen Strukturgenen noch vorhanden sein 
und gegebenerifalls genetisch verSndert worden sein, so dass die 
natiirliche Regulation ausgeschaltet und die Expression der Gene 
erhttht wurde. Das Genkonstrukt kann aber auch einfacher aufgebaut 

30 sein, das heiSt es wurden keine zus^tzlichen Regulationssignale 
vor die Nukleinsauresequenz oder dessen Derivate inseriert und 
der natiirliche Promoter mit seiner Regulation wurde nicht ent- 
femt. Stattdessen wurde die naturliche Regulations sequenz so mu- 
tiert, dass keine Regulation mehr erfolgt und/oder die Genexpres- 

35 sion gesteigert wird. Diese veranderten Promotoren kSnnen in Form 
von Teilsequenzen (= Promoter mit Teilen der erf indungsgemafien 
NukleinsSuresequenzen) auch allein vor das natiirliche Gen zur 
Steigertmg der AktivitSt gebracht werden. Das Genkonstrukt kann 
auEerdem vorteilhaf terweise auch eine oder mehrere sogenannte 

40 '^enhancer Sequenzen" fxinktionell verkniipft mit dem Promoter ent- 
halten, die eine erhohte Expression der Nukleinsauresequenz er- 
mdglichen. Auch am 3'-Ende der DNA-Sequenzen k6nnen zusStzliche 
verteilhafte Sequenzen inseriert werden wie weitere regulatori- 
sche Elemente oder Terminatoren . Die A-5-Desaturase-/A-6-Desatu- 

45 rase und/oder A-12-Desaturasegene kdnnen in einer oder mehreren 
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Kopien in der Expressionskassette (= Genkonstrukt) enthalten 
sein. 

Die regulatorischen Sequenzen bzw, Faktoren konnen dabei wie 
5 oben beschrieben vorzugsweise die Genexpression der eingefiihrten 
Gene positiv beeinflussen und dadurch erhohen. So kann eine Ver- 
stSrkiing der regulatorischen Elemente vorteilhaf terweise auf der 
Transkriptionsebene erfolgen, indem starke Transkriptionssignale 
wie Promotoren lond/oder "Enhancer" verwendet werden, Dcuieben ist 
10 aber auch eine VerstMrkung der Translation mOglich, indem bei- 
spielsweise die StabilitSLt der mRNA verbessert wird. 

Bin weiterer Aspekt der Erfindung betrifft Vektoren, z.B. 
rekombinante Expressionsvektoren, die mindestens eine der erfin- 

15 diingsgemSfien Expressionskassetten enthalten, und Wirtszellen, in 
die die erfindungsgemaSen Expressionskassetten oder diese Vekto- 
ren eingebracht worden sind, insbesondere Mikroorganismen, Pflain- 
zenzellen, Pf lanzengewebe, -organe oder ganze Pflanzen. Bei einer 
AusfUhrungsform kann eine solche Wirtszelle Feinchemikalien-Ver- 

20 bindungen, insbesondere PUFAs, speichern; zur Isolation der ge- 
wiinschten Verbindvmg werden die Zellen geerntet. Die Verbindiing 
(Ole, Lipide, Triacylglyceride/ Fettsauren) oder die Desaturase 
k6nnen dann aus dem Medium oder der Wirtszelle, welche bei Pflan- 
zen Zellen sind, die Feinchemikalien enthalten oder speichern, am 

25 starksten bevorzugt Zellen von Speichergeweben, wie SamenhUllen, 
Knollen, Epidermis- und Samenzellen, Endosperm oder Embyrogewebe 
isoliert werden. 

Noch ein weiterer Aspekt der Erfindxing betrifft eine genetisch 
30 ver^nderte transgene Pflanze, bevorzugt ein Olfruchtpflanze, wie 
vorstehend erwShnt, besonders bevorzugt eine Raps- oder Lein- 
pflanze, in die eine erfindungsgemSfie Expressionskassette, die 
vorteilhaf t weitere Gene wie Desaturasegen enthalt, eingebracht 
worden ist. Bei einer Aus fiihrungs form ist das Genom von Raps oder 
35 Lein durch Einbringen einer erf indungsgemSlSen Expressionskassette 
vorteilhaf t enthaltend weitere NukleinsSuremolekttle, die beis- 
pielsweise eine Wildtyp- oder mutierte Desaturasesequenz kodiert, 
als Transgen verSndert worden, Bei einer bevorzugten AusfCihrungs- 
form wird Raps oder Lein auch zur Produktion einer gewUnschten 
40 Verbindung, wie Lipiden \ind PettsSuren, wobei PUFAs besonders be- 
vorzugt sind, verwendet. 

Bei noch einer we iter en bevorzugten Aus ftlhr\ings form kann das 
Moos Physcomitrella patens zur Demonstration der Fxinktion eriner 
45 Expressionskassette mit einem Desaturasesegen u^iter Verwendung 
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homologer Rekombination auf der Basis der in dieser Erfindiing be- 
, schriebenen NukleinsSuren verwendet warden. 

Das Desaturasepolypeptid oder ein biologisch aktiver Teil davon 
5 kann vorteilhaf t unter Kontrolle der erf indungsgemaiSen Expres- 
sionskassette ftanktionsfShig init einem weiteren Polypeptide das 
eine andere enzymatische Aktivitat als die Desaturasen hat bei- 
spielsweise eine Elongase-, Acyl transferase- oder sonstige Akti- 
vitat verbunden werden, so dass ein Fusionsprotein gebildet wird. 

10 Vorteilhaf t hat dieses Fusionsprotein eine Aktivitat, die 
sich von derjenigen der Desaturase allein \interscheidet . Bei 
anderen bevorzugten Ausfiihrungsform nimmt dieses Fusionsprotein 
am Stoffwechsel von Verbindungen, die zur Synthese von Lipiden 
und FettsSxiren, Cofaktoren und Enzymen in Mikroorganismen oder 

15 Pflanzen notwendig sind, oder am Transport von Molektilen tiber 
diese Membranen teil. Besonders vorteilhaf t moduliert das Ein- 
bringen dieses Fusionsproteins in einer Wirtszelle die Produktion 
einer gewOnschten Verbindung innerhalb einer und durch die Zelle. 
Bei einer bevorzugten AusfiLhrungsfonn enthalten diese Fusion- 

20 sproteine auch A-4-, A-5- oder A-6, A-8-, A-15. A-17 oder 
A-19-Desaturaseaktivitaten allein oder in Kombination. Ins- 
besondere solche Genkombinationen sind bevorzugte Ausfiihrungs- 
forraen, die aus SEQ ID NO: 7 oder 9 gewahlt sind, bzw Teilen 
davon, Derivate oder ihren Homologen. Insbesondere solche 

25 Kombinatiohen sind bevorzugt, die die vollstSndige Protein- 
aktivitat wie in SEQ ID NO: 1, 3, 5 oder 11 enthalten und in 
Multiexpressionskassetten definiert durch SEQ ID NO: 13, 14, f - 
15, 16 und 17 eingefagt zur Transformation von Pflanzen und / 
Expression in Pflsmzen geeignet sind. 

30 

Eingehende Beschreibung der Erfindung 

Ein erfind\ingsgema£er Gegenstand sind auch die Expressionskasset- 
ten in Verbindung mit isolierten Nukleinsauresequenz (en) , die fur 
35 ein Polypeptid mit DesaturaseaktivitSt codiert, ausgewahlt aus 
der Gruppe: 

a) einer Nukleinsauresequenz mit der in SEQ ID NO: 1, 
SEQ ID NO: 3, SEQ ID NO: 5 Oder SEQ ID NO: 11 dar- 

40 gestellten Sequenz., 

b) Nukleinsa\iresequenzen, die aufgrund des degenerierten 
genetischen Codes durch Riickttbersetzung der in SEQ ID NO: 2, 
SEQ ID NO: 4, SEQ ID NO: 6 oder SEQ ID NO: 12 dargestellten 

45 AminosSuresequenzen erhalten werden. 
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c) Derivate der in SEQ ID- NO: 1, SEQ ID NO: 3, SEQ ID NO: 5 
Oder SEQ ID NO: 11 dargestellten Nukleinsauresequenz, 
die far Polypeptide mit der in SEQ ID NO: 2, SEQ ID NO: 4, 
SEQ ID NO: 6 Oder SEQ ID NO: 12 dargestellten Amino saures e- 
5 quenzen codieren \md mindestens 50 % Homologie auf Amino- 

saureebene aufweisen, ohne dafi die enzymatische Wirkung der 
Polypeptide wesentlich reduziert ist. 

Weiterhin betrifft die Erfindting eine Aminos auresequenz, die 
10 durch die oben genannte(n) Nukleinsauresequenz (en) codiert werden 
(fiir die Erfindung soil der Singular den Plural und umgekelirt 
umfassen) . Speziell betrifft die Erfindung Aminos auresecjuenz en, 
die durch die in SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5 Oder 
SEQ ID NO: 11 dargestellte Sequenz codiert werden*. 

15 

Die vorliegende Erfindung stellt Express ions kasset ten bereit^ die 
fvir die Expression von Nukleinscluren und Proteinmolekiile mit De- 
saturaseaktivitat geeignet sind, und von NukleinsSuren kodierend 
fiir Proteine, die am Stoffwechsel von Lipiden und Fetts^uren, 

20 PUFA-Cofaktoren und Enzymen in dem Moos Physcomitrella patens 
Oder am Transport lipophiler Verbindungen iiber Membranen betei- 
ligt sind. Die erf indungsgemalSen Verbindungen lassen sich zur Mo- 
dulation der Produktion von Feinchemikalien aus Organismen wie 
Pflanzen, wie Mais, Weizen, Roggen, Hafer, Triticale, Reis, Ger- 

25 ste, Sojabohne, Erdnuss, Baumwolle, Linum Arten wie Ol- oder Fa- 
serlein, Brassica-Arten, wie Raps, Canola und Riibsen, Pfeffer, 
Sonnenblume, Borretsch, Nachtkerze und Tagetes, Solanacaen-Pf lan- 
zen, wie Kartoffel, Tabak, Aubergine und Tomate, Vicia-Arten, 
Erbse/ Maniok, Alfalfa, Buschpflanzen (Kaffee, Kakao, Tee), Sa- 

30 lix-Arten, BSiime (Olpalme, Kokosnuss) und ausdauemden Grasem 
und Futterfeldfriichten, entweder direkt (z.B. wenn die Uberex- 
pression oder Optimierung eines Fettsaurebiosynthese-Proteins ei- 
nen direkten Einfluss auf die Ausbeute, Produktion und/oder Effi- 
zienz der Produktion der FettsSure aus modif izierten Organismen 

35 hat) verwenden oder konnen eine indirekt Auswirkung haben, die 
dennoch zu einer Steigerung der Ausbeute, Produktion und/oder Ef- 
fizienz der Produktion einer gewiinschten Verbindung oder einer 
Abnahme unerwtinschter Verbindungen fiihrt (z.B, wenn die Modula- 
tion des Stof fwechsels von Lipiden xind Fetts^uren, Cofaktoren und 

40 Enzymen zu VerSnderungen der Ausbeute, Produktion und/oder Effi- 
zienz der Produktion oder der Zusammensetzung der gewiinschten 
Verbindungen innerhalb der Zellen fiihrt, was wiederum die Produk- 
tion einer oder mehrerer Feinchemikalien beeinf lussen kann) . As- 
pekte der Erfindung sind nachstehend weiter eriautert. 

45 

I. Feinchemikalien und PUFAs 
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Der Begriff "Feinchemikalie* ist im Pachgebiet bekannt und 
ijutifasst Molekiile, die durch einen Organismus produziert worden 
sind \ind Anwendungen in verschiedenen Industrien finden, wie, 
aber nicht beschrSnkt auf, die pharmazeutische, Landwirtschafts-, 
5 Nahriingsmittel- und Kosmetik-Industrie. Diese Verbindungen um- 
fassen Lipide, Fettsauren, Cofaktoren \ind Enzyme usw. (wie z.B. 
beschrieben in Kuninaka, A. (1996) Nucleotides and related com- 
pounds/ S. 561-612, in Biotechnology Bd. 6, Rehm et al,, Hrsgb., . 
VCH: Weinheim und darin enthaltenen Literaturstellen) , Lipide, 

10 gesattigte und ungesSttigte Fettsauren (z.B. Arachidonsaure) , 
Vitamine und Cofaktoren (wie beschrieben in Ullmann's Ency- 
clopedia of Industrial Chemistry, Bd. A27, Vitamins, S. 443-613 
(1996) VCH: Weinheim und darin enthaltenen Literaturstellen; 
und Ong, A.S., Niki, E., & Packer, L. (1995) Nutrition, Lipids, 

15 Health and Disease Proceedings of the UNESCO/Confederation of 
Scientific and Technological Associations in Malaysia and the 
Society for Free Radical Research - Asien, abgehalten am 1.-3. 
Sept. 1994 in Penang, Malysia, AOCS Press (1995)), Enzyme und 
samtliche anderen von Gutcho (1983) in Chemicals by Fermentation, 

20 Noyes Data Corporation, ISBN: 0818805086, und darin angegebenen 
Literaturstellen beschriebenen Chemikalien. Der Stoffwechsel und 
die Verwendungen bestimmter Feinchemikalien sind nachstehend 
weiter eriautert. 

25 Die Kombination verschiedener Vorlauf ermolekiile und Biosynthese- 
enzyme fiihrt zur Herstellung verschiedener Fettsauremolektile, was 
eine entscheidende Auswirkxing auf die Zusammensetzung der Membran 
hat. Es kann angenommen werden, dass PUFAs nicht nur einfach in 
Triacylglycerin, sondem auch in Membranlipide eingebaut werden. 

30 

VorlSufer fiir die PUFA-Biosynthese sind beispielsweise 5lsaure, 
Linol- und Linolensaure. Diese Cia-Kohlenstoff -Fettsauren 
miissen auf C20 und C22 verlangert werden, damit Fettsauren 
vom Eicosa- und Docosa-Kettentyp erhalten werden. Mithilfe 

35 verschiedener Desaturasen, wie Enzymen, welche A-12-Desaturase, 
A-15-Desaturase, A-6-Desaturase-, A-5- und A-4-Desaturase- 
aktivitat aufweisen, konnen Arachidonsaure, EicosapentaensSure 
\ind DocossQiexaenscL\ire sowie verschiedene andere Icoigkettige PUFAs 
erhalten, extrahiert und fttr verschiedene Zwecke bei Nahrvmgs- 

40 mittel-, Futter-, Kosmetik- oder pharmazeutischen Anwendungen 
verwendet werden. 

Zur Herstellung langkettiger PUFAs miissen, wie oben erwShnt, 
die mehrfach ungesSttigten Cis- bzw C2o~Fettsauren mehrfach 
45 desaturiert werden. Die erf indungsgemaSen NukleinsSuresequenzen 
kodieren erste funktionell aktive Desaturasen aus Phyeodactylum 
tricomutum, einem Mikroorganismus , der PUFAs in der Triacyl- 
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glycerolfraktion enthSlt. Mit den erf indungsgemSSen Desaturasen 
kannen Doppelbindiingen in die A-5-/ A-6- oder A-12-Position ein- 
gefiihrt werden. Die Aktivitaten der erf indiingsgemSfien Desaturasen 
ftlhrt vorzugsweise zu Cis- + C20~Fettsauren mit mindestens zwei, 
5 drei, vier oder fiinf Doppelbindungen im FettsSuremolektil , vor- 
zugsweise zu C20"Fsttsauren mit vorteilhaft drei, vier oder 
fOnf Doppelbindungen im FettsauremolekUl, Die Desaturierung kann 
vor Oder nach Elongation der entsprechenden FettsSure erfolgen. 
Daher fiihren die Produkte der DesaturaseaktivitcLten und der mog- 

10 lichen weiteren Desaturierung und Elongation zu bevorzugten PUFAs 
mit hoherem Desaturierungsgrad, einschliefilich einer weiteren 
Elongation von C20 C22"Fettsauren, zu FettsSLuren wie LinolsSxire, 
DocosadienscLure, dihomo-y-linolensaure, Arachidonsaur e , (D6-Eicosa- 
triendihomo-7-linolensaure, Eicosapentaensclure, a)3-Eicosatrien- 

15 s&ure, a)3-Eicosatetraensaure, DocosapentaensSure oder Docosa- 
hexaensaure. Sxibstrate dieser erfindungsgemafien Enzymaktivitat 
sind zum Beispiel Taxols^ure, 6, 9-Octadecadiensaure, Qlsaure, 
Linolsaure, Y'Li^^o^^^sSure, Pinolensaure, a-Linolensa\ire, Ara- 
chidonsaure, EicosapentaensSure oder Stearidonsaure . Bevorzugte 

20 Substrate sind LinolsSure, 7-Linolensaure und/ oder a-Linolensaure, 
dihomo-Y**li^oi®^saure bzw. Arachidonsaure , Eicosatetraensaure 
oder Eicosapentaensaure . Die Cig-oder C20-F^ttsauren mit min- 
destens zwei Doppelbindungen in der Fettsaure kttnnen durch die 
erfindungsgemafie Enzymaktivitat in Form der freien Fettsaure oder 

25 in Form der Ester, wie Phospholipide, Glykolipide, Sphingolipide, 
Phosphoglyceride, Monoacylglyceride, Diacylglyceride , Triacylgly- 
ceride oder sonstige Ester, verlangert werden. 
Ferner mtissen FettsSuren anschlieBend an verschiedene 
Modifikationsorte transportiert und in das Triacylglycerin- 

30 Speicherlipid eingebaut werden. Ein weiterer wichtiger Schritt 
bei der Lipidsynthese ist der Transfer von Fettsauren auf die 
polaren Kopfgruppen, beispielsweise durch Glycerin-FettsSure- 
Acyl transferase (siehe Frentzen, 1998, Lipid, 100 (4-5) : 161-166) . 

35 Verdf fentlichungen iiber die Pf lanzen-Fettsfiurebiosynthese, 
Desaturierung, den Lipids toff wechsel und Membrantransport 
von fetthaltigen Verbindungen, die Betaoxidation, FettsSure- 
modifikation und Cofaktoren, Triacylglycerin-Speichervuig und 
-Assemblierung einschlielSlich der Literaturstellen darin siehe 

40 in den folgenden Artikeln: Kinney, 1997, Genetic Engeneering, 
Hrsgb.: JK Setlow, 19:149-166; Ohlrogge und Browse, 1995, Plant 
Cell 7:957-970; Shanklin und Cahoon, 1998, Annu, Rev. Plant 
Physiol. Plant Mol. Biol. 49:611-641; Voelker, 1996, Genetic 
Engeneering, Hrsgb.: JK Setlow, 18:111-13; Gerhardt, 1992, Prog. 

45 Lipid R. 31:397-417; Gtihnemann-Schaf er & Kindl, 1995, Biochim. 
Biophys Acta 1256:181-186; Kunau et al., 1995, Prog. Lipid Res. 
34:267-342; Stymne et al., 1993, in: Biochemistry and Molecular 
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Biology of Membrane and Storage Lipids of Plants, Hrsgb, : 
Murata und Somerville, Rockville, American Society of Plant 
Physiologists, 150-158, Murphy & Ross 1998, Plant Journal. 
13(1) :1-16. 

5 

Vitamine, Cofaktoren xind Nutraceutical wie PUFAs, xomfassen eine 
Gruppe von Moleldilen, die hohere Tiere nicht mehr synthetisieren 
konnen und somit aufnehiaen miissen oder die hohere Tiere nicht 
mehr ausreichend selbst herstellen kSnnen und somit zusatzlich 

10 aufnehmen miissen, obwohl sie leicht von anderen Organismen, wie 
Bakterien, synthetisiert werden. Die Biosynthese dieser Molektlle 
in Organismen, die sie produzieren k6nnen, wie in Bakterien, 
ist im groEen und ganzen charakterisiert worden {Ullmann's 
Encyclopedia of Industrial Chemistry, "Vitamins", Bd. A27, 

15 S. 443-613, VCH: Weinheim, 1996; Michal, G. (1999) Biochemical 
Pathways: An Atlas of Biochemistry and Molecular Biology/ 
John Wiley & Sons; Ong, A.S., Niki, E., & Packer, L, (1995) 
"Nutrition, Lipids, Health and Disease" Proceedings of the 
UNESCO/Confederation of Scientific and Technological Associations 

20 in Malaysia and the Society for Free Radical Research Asia, 

abgehalten am 1.-3. Sept. 1994 in Penang, Malaysia, AOCS Press, 
Champaign, IL X, 374 S) . 

Die oben erw^hnten Molekiile sind entweder selbst biologisch 

25 aktive Molekaie oder Vorstufen biologisch aktiver Substanzen, die 
entweder als Elektronenubertrfiger oder Zwischenprodukte bei einer 
Vielzahl von Stof fwechselwegen dienen. Diese Verbindungen haben 
neben ihrem Nahrwert auch einen signif ikanten industriellen Wert 
als Farbstoffe, Antioxidantien und Katalysatoren oder andere Ver- 

30 cirbeitungshilfsstoffe. (Einen Uberblick Uber Struktur, Aktivitat 
und industrielle Anwendungen dieser Verbindxmgen siehe z.B. 
in Ullmann's Encyclopedia of Industrial Chemistry, "Vitamins", 
Bd. A27, S. 443-613, VCH: Weinheim, 1996). Mehrfach ungesattigte 
Fettsauren haben verschiedene Funktionen und gesundheitsf Srdemde 

35 Wirkungen, beispielsweise bei koronarer Herzerkrankung, Ent- 
ziindungsmechanismen, Kinderemahrung usw. Verof f entlichungen 
und Literaturstellen, einschlieSlich darin zitierter Literature 
stellen, siehe in: Simopoulos, 1999, Am. J. Clin. Nutr. 70 
(3. Suppl- ) :560-569, Takahata et al,, Biosc. Biotechnol. Biochem. 

40 1998, 62(11) :2079-2085, Willich und Winther, 1995, Deutsche 
Medizinische Wochenschrift 120(7) :229ff . 

XX. Elemente und Verfahren der Erfindung 

45 Die vorliegende Erfindung beruht vmter anderem auf der Entdeckimg 
neuer Molekiile, die hier als Desaturasenukleinsclure- und 
-proteinmolektile bezeichnet werden, welche eine Wirkung auf 
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die Produktion von Zellmembranen und Lipiden Phaeodactylum tri- 
cornutum ausiiben und beispielsweise die Bewegung von Molekiilen 
liber diese Membrcuien beeinf lussen. Bei einer Ausftihrungsf orm 
nehmen die DesaturasemoleWlle am Stoffwechsel von zum Aufbau von 
5 Zellmembranen in Organismen, wie Mikroorganismen iind Pflanzen, 
notwendigen Verbindungen teil oder beeinflussen indirekt den 
Transport von Molektilen iiber diese Membranen. Bei einer bevor- 
zugten AusfUhriingsform hat die Aktivitat der erf indxangsgemSfien 
Desaturasemolektile zxxr Regulation der Produktion von Membran- 

10 komponenten und des Membrantransports eine Auswirkxing auf 
die Produktion der gewtoschten Feinchemikalie durch diesen 
Organismus. Bei einer besonders bevorzugten Ausfiihrungsform 
ist die Aktivitat der erf indungsgemSEen Desaturasemolekille 
moduliert, so dass die Ausbeute, Produktion und/oder Effizienz 

15 der Produktion der Stof fwechselwege von Mikroorganismen oder 
Pflanzen, welche die erfindungsgemSfien Desaturasen regulieren, 
moduliert sind \md die Effizienz des Transport von Verbindungen 
durch die Membranen ver^ndert ist, was entweder direkt oder 
indirekt die Ausbeute, Produktion und/oder Effizienz der 

20 Produktion einer gewOnschten Feinchemikalie durch Mikroorganismen 
\md Pflanzen moduliert. 

Der Begriff "Desaturase" oder "Desaturasepolypeptid" umfasst 
Proteine, die an der Desaturierimg von Fettsauren teilnehmen. 

25 Beispiele fiir Desaturasen sind in der SEQ ID NO: 1, 2, 5, 11 
Oder ihren Homologen, Derivaten oder Analoga offenbart. Die 
Begriff e Desaturase oder Desaturasenukleins^uresequenz (en) 
umfassen Nukleinsauresequenzen, die eine Desaturase kodieren 
und bei denen ein Teil eine kodierende Region und ebenfalls 

30 entsprechende 5'- und 3 ' -untranslatierte Sequenzbereiche sein 
k6nnen. Beispiele ftir Desaturase-Gene sind die in SEQ ID NO: 1, 
3, 5 Oder 11 dargestellten. Die Begriffe Produktion oder 
Produktivitat sind im Fachgebiet bekannt und beinhalten die 
Konzentration des Fermentationsproduktes (zum Beispiel der 

35 gewiinschten Feinchemikalie) , das in einer bestimmten Zeitspanne 
und einem bestimmten Fermentationsvolumen gebildet wird (z.B. 
kg Produkt pro Stunde pro Liter) . Der Begriff Effizienz der 
Produktion Tjuoafasst die* Zeit, die zur Erzielung einer bestimmten 
Produktionsmenge n5tig ist (z.B. wie lange die Zelle zur Auf- 

40 richtung einer bestimmten Durchsatzrate einer Feinchemikalie 
ben5tigt) . Der Begriff Ausbeute oder Produkt /Kohlenstoff- 
Ausbeute ist im Fachgebiet bekannt und umfasst die Effizienz 
der Itorwsmdlung der Kohlenstoff quelle in das Produkt (d.h. die 
Feinchemikalie) . Dies wird gewdJhnlich beispielsweise ausgedriickt 

45 als kg Produkt pro kg Kohlenstoff quelle. Durch Erhc5hen der 
Ausbeute oder Prodiiktion der Verbind\mg wird die Menge der 
gewonnenen Molekttle oder der geeigneten gewonnenen Molekttle 
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dieser Verbindung in einer bestimmten Kulturmenge uber einen 
festgelegten Zeitraiun erh5ht. Die Begriffe Biosynthese oder 
Biosyntheseweg sind im Fachgebiet bekannt und uiafassen die 
Synthase einer Verbindung, vorzugsweise einer organischen Ver- 
5 bindung, durch eine Zelle aus Zwischenverbindimgen, beispiels- 
weise in einem Mehrschritt- \ind stark regulierten Prozess. Die 
Begriffe Abbau oder Abbauweg sind im Fachgebiet bekannt vnd 
uiafassen die Spaltung einer Verbindung, vorzugsweise einer 
organischen Verbindung, durch eine Zelle in Abbauprodukte 

10 (allgemeiner gesagt, kleinere oder weniger komplexe Molekiile) 
beispielsweise in einem Mehrschritt- und stark regulierten 
Prozess, Der Begriff Stoffwechsel ist im Fachgebiet bekannt 
und \imfasst die Gesamtheit der biochemischen Reaktionen, die in 
einem Organismus stattfinden. Der Stoffwechsel einer bestimmten 

15 Verbindxmg (z.B. der Stoffwechsel einer Fettsaure) umfasst dann 
die Gesamtheit der Biosynthese-, Modif ikations- und Abbauwege 
dieser Verbindung in der Zelle, die diese Verbindung betreffen. 

Bei einer anderen Aus fuhrungs form konnen die erf indungsgemaSen 

20 NukleinsSuresequenzen, die fur Desaturase-Molekiile codieren, die 
Produktion eines gewiinschten Molekuls, wie einer Feinchemikalie, 
in einem Mikroorganismus oder in Pflanzen modulieren, Es gibt 
eine Reihe von Mechanismen, durch die die Veranderung einer 
erf indungsgemafien Sequenz die Ausbeute, Produktion \md/oder 

25 Effizienz der Produktion einer Feinchemikalie aus einem Mikro- 
organismus- oder Pflanzenstamm, die dieses veranderte Protein 
enthalten, direkt beeinflussen kann. Die Anzahl oder Aktivitat 
von Desaturasen, die am Transport von Feinchemikalienmolekiilen 
innerhalb oder aus der Zelle beteiligt sind, kann erhoht werden, 

30 so dass grSfiere Mengen dieser Verbindungen ilher Membranen trans- 
portiert werden, aus denen sie leichter gewonnen und ineinander 
umgewandelt werden. Ferner sind Fettsauren, Triacylglycerine 
und/oder Lipide selbst wiinschenswerte Feinchemikalien; durch 
Optimierung der AktivitMt oder Steigem der Anzahl einer oder 

35 mehrerer erf indungsgemSSer Desaturasen, die an der Biosynthese 
dieser Verbindungen beteiligt sind, oder durch Storen der Aktivi- 
tat einer oder mehrerer Desaturasen, die am Abbau dieser Ver- 
bindtingen beteiligt sind, kcinn es moglich sein, die Ausbeute, 
Produktion und/oder Effizienz der Produktion von Fettsaure- und 

40 Lipidmolekaien aus Organismen, wie Mikroorganismen oder Pflanzen, 
zu erhdhen. 

Die Mutagenese der genannten "Nukleinsauresequenzen kann Desatura- 
sen mit verSnderten AktivitSten hervorbringen, welche die Produk- 
45 tion einer oder mehrerer gewUnschter Feinchemikalien aus Mikroor- 
ganismen Oder Pflanzen indirekt beeinflussen. Beispielsweise kon- 
nen Desaturasen, die am Export von Abfallprodukten beteiligt 
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sind, eine grdfiere Anzahl Oder hOhere Aktivitat aufweisen, so 
dass die normalen Stof fwechselabfaile der Zelle (deren Menge m5g- 
licherweise aufgrund der Oberproduktion der gewtinschten Feinche- 
mikalie erhoht ist) effizient exportiert werden, bevor sie die 
5 Molekule in der Zelle scMdigen kSnnen (was die Lebensf ahigkeit 
der Zelle herabsetzen wUrde) oder die Feinchemikalien-Biosynthe- 
sewege st6ren k6nnen (was die Ausbeute, Produktion oder Effizienz 
der Produktion einer gewtinschten Feinchemikalie senken wtirde) . 
Die relativ grofien intrazellularen Mengen der gewiinschten Fein- 

10 chemikalie selbst konnen femer ftir die Zelle toxisch sein, so 
dass man durch Steigern der Aktivit^t oder Anzahl von Trans - 
portem, die diese Verbindimgen aus der Zelle exportieren konnen, 
die LebensfcLhigkeit der Zelle in Kultur steigern kann, was wie- 
derum zu einer grofieren Anzahl an Zellen in der Kultur fiihrt, 

15 welche die gewiinschte Feinchemikalie produzieren. Die Desaturasen 
konnen auch so manipuliert werden, dass die entsprechenden Mengen 
unterschiedlicher Lipid- und Fettsauremolektlle produziert werden. 
Dies kann eine erhebliche Auswirkxing auf die Lipidzusammensetzung 
der Zellitiembran haben. Da jeder Lipidtyp unterschiedliche physi- 

20 kalische Eigenschaf ten aufweist, kann eine VerMnderung der Lipid- 
zusainmensetzung einer Membran die Membranf luiditat signif ikant 
ver&idern. Anderungen der Membranf luiditat konnen den Transport 
von Molekulen \iber die Membran sowie die Integritat der Zelle 
beeinflussen, was jeweils eine erhebliche Auswirkung auf die 

25 Produktion von Feinchemikalien aus Mikroorganismen und Pflanzen 
in Fermentationskultur im groSen MaSstab hat. Pf lanzenmembranen 
verleihen spezifische Eigenschaf ten, wie Toleranz gegeniiber 
WSrme, Kalte, Salz, Trockenheit sowie Toleranz gegen Pathogene, 
wie Bakterien und Pilze, 

30 

Die genannten isolierten Nukleinsauresequenzen sind im Genom ei- 
nes Phaeodactylum tricornutum UTEX646-Stammes enthalten, der iiber 
die Algensammlung der University of Texas, Austin verfdgbar ist, 

35 Die Nukleotidsequenz der Phaeodactylum tricornutvim-cDNA land die 
abgeleiteten Aminosauresequenzen der Desaturasen sind in den 
SEQ ID NO: 1 bis 6 sowie 11 und 12 gezeigt. Es wurden Computera- 
nalysen durchgefiihrt, die diese Nukleotidsequenz en als Sequenzen 
klassif izieren und/oder identifizieren, die am Stof fwechsel von 

40 Zellmembrankomponenten beteiligte Proteine oder am Transport von 
Verbindxingen Ober Zellmembranen beteiligte Proteine bzw. der PUFA 
Biosynthese codieren. EST's mit der Datenbankeingabe-NO: 
PT001070010R und PT001078032R durch die Erfinder stellen die er- 
findungsgemafien Sequenzen in SEQ ID NO: 1 und 3 dar. Die Sequenz 

45 des Fragments aus EST PT001070010R wurde ermittelt und ist wie 
dargestellt in SEQ ID* NO: 5. Analog, ist die Sequenz des Klones 
PT001078032R dargestellt in SEQ ID NO: 1. Den Klonen wurden Gen- 
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namen zugewiesen. Abkiirziingen bedeuten: Pp = Physcomitrella pa- 
tens, Pt = Phaeodactylum tricornutiom. PT001070010R aus SEQ ID NO: 
5 codiert fiir ein neues Gen homolog zu A-12-Desaturase \jLnd 
PT001078032R codiert fiir eine neuartige A-5-Desaturase. Pt_des6 
5 kann gemafi Beispiel 5a mittels Polymerase Kettenreaktion unter 
Zuhilfenahme degenerierter Oligonukleotide isoliert werden. Ein 
so erhaltenes Fragment kann z\m Sichten einer cDNA Bank aus 
Phaeodactyliam tricornutvim isoliert werden und die codierende Re- 
gion einer Phaeodactylum tricornutiam A-6-Desaturase erhalten wer- 

10 den. Ein so isoliertes Gen wird in Tabelle 1 als Pt_des6 bezeich- 
net und ist in SEQ ID NO: 3 dargestellt. Die korrespondierenden 
Aminosfiuresequenzen werden durch tibersetzung des genetischen Co- 
des der Sequenz ID NO: 1, 3 und 5 erhalten und sind als SEQ ID 
NO: 2, 4 und 6 definiert (siehe auch Tabelle 1) . Auch eine wei- 

15 tere Nukleinsauresequenz, die fiir eine A-12-Desaturase codiert, 
ist Tabelle 1 zu entnehmen. Sie tragt die Klon-Nummer 
PT001072031R. 

Tabelle 1 

20 





Gennaitie 


Klonname 


Nukleinsaure 
SEQ ID NO: 


Polypeptid 

SEQ ID NO: 


D5 Desaturase 


Pt_des5 


PT001078032R 


1 


2 


D6 Desaturase 


Pt_des6 


Pt_des6 


3 


4 


D12 Desaturase 


Pt_desl2 


PT001070010R 


5 


6 


D6 Desaturase 


Pp_des6 


Pp_des6 


7 


8 


D6 Elongase 


Pp_PSEl 


PP001019019F 


9 


10 


A12 Desaturase 


Pt desl2.2 


PT001072013R 


11 


12 



30 Die vorliegende Erfindung betrifft auch Proteine mit einer Amino- 
sclureseguenz , die im wesentlichen homolog zu einer AminoscLure- 
sequenz der SEQ ID NO: 2, 4, 6 oder 12 ist. Wie hier verwendet, 
ist ein Protein mit einer Aminosauresequenz , die im wesentlichen 
homolog zu einer ausgewShlten Aminosauresecjuenz ist, zu min- 

35 destens etwa 50 % homolog zu der ausgewahlten AminosSuresequenz, 
z.B. der gesamten ausgewahlten Aminosauresequenz . Ein Protein mit 
einer Aminosauresequenz, die im wesentlichen homolog zu einer 
ausgewahlten Aminosauresequenz ist, kann auch zu mindestens etwa 
50 bis 60 %, vorzugsweise mindestens etwa 60 bis 70 % wad starker 

40 bevorzugt mindestens etwa 70 bis 80 %, 80 bis 90 % oder 90 bis 
95 % und am stSrksten bevorzugt mindestens etwa 96 %, 97 %, 98 %, 
99 % Oder mehr homolog zu einer ausgewahlten Aminosauresequenz 
sein. 

45 Die Desaturasen oder der biologisch aktive Telle oder Fragmente 
davon k5iuien am Stof fwechsel von Lipiden zum Aufbau von Zellmem- 
branen oder Speicherlipiden in Organismen teilnehmen und in Kom- 
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bination mit weiteren Genen, insbesondere solchen mit Elongaseak- 
tivitSt zur Elongation von Cie-bzw C20-22-PUFAS benotigten Aktivi- 
taten beitragen, so dass Cis, C20-/ C22- oder C24-'PUFAs sowie ver- 
wandte PUFAs erhalten werden. 

Dabei konnen die Desatiirasen in Kombination mit Elongasen xind an- 
deren Desaturasen in erfind\ingsgemalSen Expressionskassetten klo- 
niert werden und zur Transformation von Pflanzen mithilfe von 
Agrobakterixm eingesetzt werden. 

10 

Verschiedene Aspekte der Erfindxang sind eingehender in den 
folgenden Unterabschnitten beschrieben. 

A. Isolierte Nukleins^uremolekiile 

15 

Eine AusfOhningsform der Erfindung sind isolierte NukleinsSuren, 
die von PUFA produzierenden Mikroorganismen stammen und fiXx Poly- 
peptide kodieren, die Cis'-oder C2o-22-Fettsaiiren mit mindestens 
einer, zwei, drei oder vier Doppelbindungen in der Fettsaure 
20 desaturieren. 

Eine weitere erf indungsgemafie Ausfilhrxingsform sind isolierte 
NukleinsSuren, iimfassend Nukleotidsequenzen, die fur Polypeptide 
kodieren, die Cia-bzw C2o^Fettsauren mit mindestens ein, zwei, 
25 drei oder vier Doppelbindungen in der FettsSure desaturieren 
und sind aus der Gruppe, bestehend aus 

a) einer NukleinsSuresequenz mit der in SEQ ID NO: 1, 
SEQ ID NO: 3, SEQ ID NO: 5 oder SEQ ID NO: 11 dar- 

30 gestellten Sequenz, 

b) NukleinsSuresequenzen/ die aufgrund des degenerierten 
genetischen Codes durch Rtlckiibersetzung der in SEQ ID NO: 2, 
SEQ ID NO: 4, SEQ ID NO: 6 oder SEQ ID NO: 12 dargestellten 

35 Aminos^ureseguenzen erhalten werden, 

c) Derivate der in SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5 
Oder SEQ ID NO: II dargestellten NukleinsSuresequenz, die 
far Polypeptide mit der in SEQ ID NO: 2, SEQ ID NO: 4, 

40 SEQ ID NO: 6 oder SEQ ID NO: 12 dargestellten Aminosaure- 

sequenzen codieren \ind mindestens 50 % Homologie auf Amino- 
sclureebene aufweisen, ohne dass die enzymatische Wirkung 
der Polypeptide wesentlich reduziert ist. 



45 
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Die oben genannte erf indiingsgemfifie NukleinsSure stainmt von 
Organismen, wie Ciliaten, Pilzen/ Algen oder Dinof lagellaten, 
die PUFAs synthetisieren kSnnen, vorzugsweise von Phaeodactyliam 
tricornutum oder nah verweindten Organismen. 

5 

Ein Aspekt der Erfindiing betrifft isolierte Expressionskassetten 
sowie NukleinsSuremolekClle, die Desaturase-Polypeptide oder bio- 
logisch aktive Teile davon kodieren, sowie NukleinsSuref ragmente 
von diesen, die ziir Verwendiing als Hybridisierungssonden oder 

10 Primer zur Identif iziening oder Amplif izierxing einer Desaturase- 
kodierenden NukleinsSure (z,B. Desaturase-DNA) ausreichen. Der 
Begriff ''Nukleins^uremolekiil" , wie hier verwendet, soli DNA-Mole- 
kiile (z.B. cDNA oder genomische DNA) irnd RNA-Molekule (z.B. mRNA) 
sowie DNA- oder RNA-Analoga, die mittels Nukleotidanaloga erzeugt 

15 werden^ umfassen. Dieser Begriff umfasst zudem die am 3'* und am 
5'-Gnde des kodierenden Genbereichs gelegene iintranslatierte Se- 
quenz: mindestens 500, bevorzugt 200, besonders bevorzugt 100 Nu- 
kleotide der Seguenz stromaufwSrts des 5'-Endes des kodierenden 
Bereichs und mindestens 100, bevorzugt 50, besonders bevorzugt 20 

20 Nukleotide der Sequenz stromabw^rts des 3'-Endes des kodierenden 
Genbereichs . Das NukleinsSuremolektil kann einzelstrangig oder 
doppelstrangig sein, ist aber vorzugsweise doppelstrangige DNA. 
Ein "isoliertes" Nukleinsaiiremolekul wird von anderen Nukleinsau- 
remolekUlen abgetrennt, die in der naturlichen Quelle der Nu- 

25 kleinsSure vorliegen. Eine "isolierte" NukleinsSure hat vorzugs- 
weise keine Sequenzen, welche die Nukleinsaure in der genomischen 
DNA des Organismus, aus dem die Nukleinsaure stammt, natiirlicher- 
weise flankieren (z.B. Sequenzen, die sich an den 5'- und 3 '-En- 
den der Nukleinsaure befinden) . Bei verschiedenen Ausfiihrungsfor- 

30 men kann das isolierte Desaturase-Nukleinsauremolekiil z\m Bei- 
spiel weniger als etwa 5 kb, 4 3cb, 3 kb, 2 kb, 1 kb, 0,5 kb oder 
0,1 kb an Nukleotidsecjuenzen enthalten, die natiirlicherweise das 
Nukleinsauremolekiil in der genomischen DNA der Zelle, aus der die 
NukleinscLure stammt (z.B. eine Physcomitrella patens-Zelle) 

35 flankieren. Ein "isoliertes" Nukleinsauremolekiil, wie ein cDNA- 
Molekiil, kann iiberdies im wesentlichen frei von anderem zellu- 
laren Material oder Kulturmedium sein, wenn es durch rekombincuite 
Techniken hergestellt wird, oder frei von chemischen Vorstufen 
Oder anderen Chemikalien sein, wenn es chemisch synthetisiert 

40 wird. 

Ein erfindungsgemSfie Expressionskassette mit der Struktur SEQ ID 
NO: 32 -Promotor- SEQ ID NO: 33, SEQ ID NO: 34 oder SEQ ID NO: 35 
Nukleinsauremolekiil, z.B. ein Nukleinsauremolekiil mit einer Nu- 
45 kleotidsequenz der SEQ ID N0:1 oder eines Teils davon, kann unter 
Verwendung molekularbiologischer Standardtechniken und der hier 
bereitgestellten Seguenzinformation isoliert werden. Auch kann 
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mithilfe von Vergleichsalgorithmen beispielsweise eine homologe 
Sequenz oder homologe, konservierte Sequenzbereiche auf DNA oder 
AminosSureebene identifiziert werden. Beispielsweise kann aus ei- 
ner Phaeodactylum tricornutum cDNA aus einer Phaeodactylum tri- 
5 cornutum-Bank isoliert werden, indem die vollstSndige SEQ ID 
N0:1, 3, 5 Oder 11 oder ein Teil davon als Hybridisierungssonde 
sowie Standard-Hybridisienmgstechniken (wie z.B. beschrieben 
in Sambrook et al.. Molecular Cloning: A Laboratory Manual. 
2. Aufl., Cold Spring Harbor Laboratory, Cold Spring Harbor Labo- 

10 ratory Press, Cold Spring Harbor, NY, 1989) verwendet werden, 

(iberdies ISsst sich ein NukleinsSuremolekiil, \imfassend eine voll- 
standige Sequenz der SEQ ID NO: 1, 3, 5 oder 11 oder einen Teil 
davon, durch Polymerasekettenreaktion isolieren, wobei Oligonu- 
kleotidprimer, die auf der Basis dieser Sequenz oder von Teilen 

15 davon, insbesondere Regionen um Motive aus Beispiel 5a erstellt 
werden oder Modifikationen ebensolcher in einzelnen definierten 
Aminosauren, verwendet werden (z.B. kann ein NukleinsSuremoleldil , 
umfassend die vollstSndigen Sequenz der SEQ ID N0:1, 3, 5 oder 11 
Oder einen Teil davon, durch Polymerasekettenreaktion unter Ver- 

20 wendung von Oligonukleotidprimem isoliert werden, die auf der 
Basis dieser gleichen Sequenz der SEQ ID NO: 1, 3, 5 oder 11 er- 
stellt worden sind) . Z\m Beispiel lasst sich mRNA aus Zellen iso- 
lieren (z.B. durch das Guanidiniumthiocyanat-Extraktionsverf ahren 
von Chirgwin et al. (1979) Biochemistry 18:5294-5299) \md cDNA 

25 mittels Reverser Transkriptase (z.B. Moloney-MLV-Reverse-Trans- 
kriptase, erhaitlich von Gibco/BRL, Bethesda, MD, oder AMV-Re- 
verse-Transkriptase, erhaltlich von Seikagaku America, Inc., 
St. Petersburg, FL) herstellen. Synthetische Oligonukleotidprimer 
zur Amplif izierung mittels Polymerasekettenreaktion lassen sich 

30 auf der Basis einer der in SEQ ID NO: 1, 3, 5 oder 11 sowie der 
in Figur 5a gezeigten Sequenzen oder mithilfe der in SEQ ID NO: 
2, 4, 6 Oder 12 dargestellten Aminosauresequenzen erstellen. Eine 
erf indxingsgemaJSe NukleinsSure kann unter Vewendung von cDNA 
Oder altemativ von genomischer DNA als Matrize \and geeigneten 

35 Oligonukleotidprimem gemafi Standard-PCR-Amplif ikationstechniken 
amplif iziert werden. Die so amplif izierte NukleinsSure kann in 
einen geeigneten Vektor kloniert werden und mittels DNA-Sequenz- 
analyse charakterisiert werden. Oligonukleotide, die einer 
Desaturase-Nukleotidsequenz entsprechen, konnen durch Standard- 

40 Syntheseverf ahren, beispielsweise mit einem automatischen DNA- 
Synthesegerat, hergestellt werden. 

Die in SEQ ID NO: 1,3, 5 oder 11 gezeigte cDNA \imfasst Sequenzen, 
die Desaturasen kodieren, (d.h. den "kodierenden Bereich") sowie 
45 5'-\intranslatierte Sequenzen und 3 ' -xmtranslatierte Sequenzen. 
Alternativ kann das NukleinsSuremolekai nur den kodierenden 
Bereich einer der Sequenzen in SEQ ID NO: 1, 3, 5 oder 11 \m- 
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fassen oder kaim ganze genomische Fragiaente, die aus genomischer 
DNA isoliert sind, enthalten. 

Bei einer weiteren bevorzugten Aus fiihrxings form umfasst ein 
5 erf ind\mgsgemafies isoliertes NukleinsSuremolekul ein Nuklein- 
sauremolekiil, das ein Komplement einer der in SEQ ID NO: 1, 3, 5 
Oder 11 gezeigten Nukleotidseguenzen oder eines Teils davon ist. 
Ein NukleinsSuremolekiil , das zu einer der in SEQ ID NO: 1, 3, 5 
oder 11 gezeigten Nukleotidseguenzen komplementar ist, ist dann 
10 ausreichend komplementar, wenn es mit einer der in SEQ ID NO: 1, 
3, 5 oder 11 angegebenen Sequenzen hybridisieren kann, wodurch 
ein stcJDiler Duplex entsteht. 

Homologe der neuen Desaturase-Nukleins^uresequenzen mit der 

15 Sequenz SEQ ID NO: 1, 3, 5 oder 11 bedeutet beispielsweise 

allelische Varianten mit mindestens etwa 50 bis 60 %/ vorzugs- 
weise mindestens etwa 60 bis 70 %, stMrker bevorzugt mindestens 
etwa 70 bis 80 %, 80 bis 90 % oder 90 bis 95 % und noch starker 
bevorzugt mindestens etwa 95 %, 96 %, 97 %, 98 %, 99 % oder 

20 mehr Homologie zu einer in SEQ ID NO: 1, 3, 5 oder 11 gezeigten 
Nukleotidseguenzen oder ihren Homologen, Derivaten oder Analoga 
oder Teilen davon. Bei einer weiteren bevorzugten Aus fuhrungs form 
umfasst ein isoliertes erf indungsgemSEes NukleinsSuremolekul eine 
Nukleotidseguenz , die an eine der in SEQ ID NO: 1, 3, 5 oder 11 

25 gezeigten Nukleotidseguenzen oder einen Teil davon hybridisiert, 
z.B. unter stringenten Bedingxingen hybridisiert. Allelische 
Varicmten umfassen insbesondere f\mktionelle Varianten, die 
sich durch Deletion, Insertion oder Substitution von Nukleotiden 
aus /in der in SEQ ID NO: 1, 3, 5 oder 11 dargestellten Sequenz 

30 erhalten lassen, wobei aber die Absicht ist, dass die Enzym- 
aktivitS^t der davon herruhrenden synthetisierten Proteine filr 
die Insertion eines oder mehrerer Gene vorteilhaf terweise bei- 
behalten wird. Proteine , die noch die enzymatische Aktivitat der 
Desaturase besitzen, das heiEt deren Aktivitat im wesentlichen 

35 nicht reduziert ist, bedeutet Proteine mit mindestens 10 %, vor- 
zugsweise 20 %, besonders bevorzugt 30 %, ganz besonders bevor- 
zugt 40 % der urspriinglichen Enzymaktivitat, verglichen mit dem 
durch SEQ ID NO: 2, 4, '6 oder 12 kodierten Protein. 

40 Homologen der SEQ ID NO: 1, 3, 5 oder 11 bedeuten beispiels- 
weise auch bakterielle, Pilz- und Pf lanzenhomologen^ verkiirzte 
Sequenzen, einzelstrangige DNA oder RNA der kodierenden und 
nicht-kodierenden DNA-Seguenz . 

45 Homologen der SEQ ID NO: 1, 3, 5 oder 11 bedeutet auch 

Derivate, wie beispielsweise Promotorvarianten . Die Promotoren 
stromaufwarts der angegebenen Nukleotidseguenzen k6nnen durch 
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einen oder mehreire Nukleotidaustausche, durch Insertion (en) 
und/oder Deletion (en) modifiziert werden, ohne dass jedoch die 

Funktionalitat oder AktivitSt der Promotoren gest6rt wird. Es 
ist weiterhin moglich, dass die Aktivitat der Promotoren durch 
5 Modifikation ihrer Sequenz erhoht ist oder dass sie vollstSndig 
durch aktivere Promotoren, sogar aus heterologen Organismen, 
ersetzt werden. 

Cberdies kann das erf indungsgemaiSe NukleinsSuremolekul nur 

10 einen Teil des kodierenden Bereichs einer der Sequenzen in 

SEQ ID NO: 1, 3, 5 oder 11 umfassen, zum Beispiel ein Fragment, 
das als Sonde oder Primer verwendet werden kann, oder ein 
Fragment, welches einen biologisch aktiven Abschnitt einer 
Desaturase kodiert. Die aus der Klonierung des Desaturase-Gens 

15 von Phaeodactylum tricomutum ermittelten Nukleotidsequenzen 

ermSglichen die Erzeugiang von Sonden und Primern, die zur Identi- 
fizierung \ind/oder Klonierxing von Desaturase-Homologen in anderen 
Zelltypen vind Organismen sowie Desattirase-Homologen aus anderen 
Mikroalgen oder verwandten Art en gestaltet sind. Die Sonde/der 

20 Primer lamfasst gew6hnlich im wesentlichen gereinigtes Oligo- 

nukleotid. Das Oligonukleotid umfasst gewohnlich einen Nukleotid- 
sequenzbereich, der unter stringent en Bedingungen an mindestens 
etwa 12, vorzugsweise etwa 16, starker bevorzugt etwa 25, 40, 50 
Oder 75 aufeinanderfolgende Nukleotide eines Sense-Stranges einer 

25 der in SEQ ID NO: 1, 3, 5 oder 11 angegebenen Sequenzen, eines 
Antisense-Stranges einer der in SEQ ID NO: 1, 3, 5 oder 11 an- 
gegebenen Sequenzen oder seiner Homologen, Derivate oder Analoga 
Oder natiirlich vorkoramender Mutanten davon hybridisiert . Primer 
auf der Basis einer Nukleotidsequenz der SEQ ID NO: 1, 3, 5 

30 Oder 11 k5nnen in PCR-Reaktionen zur Klonierung von Desaturase- 
Homologen verwendet werden. Sonden auf der Basis der Desaturase- 
Nukleotidsequenzen konnen zum Nachweis von Transkripten oder 
genomischen Sequenzen, die das gleiche oder homologe Proteine 
kodieren, verwendet werden. Bei bevorzugten Ausftlhrungsformen 

35 umfasst die Sonde zudem eine daran gebundene Markierungsgruppe, 
z.B. ein Radioisotop, eine f lucres zierende Verbindung, ein Enzym 
Oder einen Enzym-Cofaktor . Diese Sonden kSnnen als Teil eines 
Test-Kits far genomische Marker zur Identif izierung von Zellen, 
die eine Desaturase misexprimieren, beispielsweise durch Messen 

40 einer Menge einer Desaturase-kodierenden NukleinscLure in einer 
Zellenprobe, z.B. Messen der Desat\irase-mRNA-Spiegel, oder zur 
Bestimmung, ob ein genomisches Desaturase-Gen mutiert oder 
deletiert ist, verwendet werden. 

45 Bei einer Aus filhrungs form kodiert das erf indungsgemSSe Nuklein- 
sauremolekiil ein Protein oder einen Teil davon, das/der eine 
AminosSluresequenz umfasst, die ausreichend homolog zu einer 
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AminosSuresequenz der SEQ ID NO: 2, 4, 6 oder 12 ist, dass das 
Protein oder der Teil davon die Fahigkeit, am Stoffwechsel von 
zum Aufbau von Zellmembranen in Mikroorganismen oder Pf lanzen 
notwendigen Verbindungen oder am Transport von Molekiilen \iber 
5 diese Membranen teilzunehmen, beibehSlt. Wie hier verwendet, 
betrifft der Begriff "ausreichend homolog" Proteine oder Teile 
davon, der en AminosMuresequenzen eine minimale Anzahl identischer 
Oder aquivalenter Aminosaurereste (z.B. einen AminosSurerest 
mit einer ahnlichen Seitenkette, wie ein AminosSurerest in 

10 einer der Sec[uenzen der SEQ ID NO: 2) zu einer Aminosauresequenz 
der SEQ ID NO: 2 aufweisen, so dass das Protein oder der Teil 
davon am Stoffwechsel von ziim Aufbau von Zellmembranen in Mikro- 
organismen oder Pf lanzen notwendigen Verbindungen oder am Trans- 
port von Molekaien viber diese Membranen teilnehmen kann. Protein- 

15 bestandteile dieser Stof fwechselwege fur Membrcinkomponenten 
Oder Membrantransportsysteme kSnnen, wie hier beschrieben, 
eine Rolle bei der Produktion und Sekretion einer oder mehrerer 
Feinchemikalien spielen. Beispiele fiir diese Aktivitaten sind 
hier ebenfalls beschrieben. Somit tragt die "F\mktion einer 

20 Desaturase" entweder direkt oder indirekt zur Ausbeute, Pro- 
duktion und/oder Effizienz der Produktion einer oder mehrerer 
Feinchemikalien bei. Beispiele fiir Desaturase-Substratspezif i- 
taten der katalytischen Aktivitat sind in Tabelle 5 und 6 
angegeben . 

25 

Bei einer weiteren Ausfiihrungsf orm kodieren Derivate des 
erf indungsgemaSen NukleinsSuremolekiils Proteine mit mindestens 
etwa 50 bis 60 vorzugsweise mindestens etwa 60 bis 70 % und 
starker bevorzugt mindestens etwa 70 bis 80 %, 80 bis 90 %, 

30 90 bis 95 % und am storks ten bevorzugt mindestens etwa 96 %, 
97 %, 98 %, 99 % Oder mehr Homologie zu einer vollstandigen 
Aminosauresequenz der SEQ ID NO: 2. Die Homologie der Aminosaure- 
sequenz kann izber den gesamten Sequenzbereich mit dem Programm 
PileUp (J- Mol. Evolution., 25, 351-360, 1987, Higgins et al., 

35 CABIOS, 5, 1989:151-153) oder BESTFIT oder GAP bestimmt 

(Henikoff , S, and Henikoff , J. G. (1992) . Amino acid substitution 
matrices from protein blocks. Proc. Natl. Acad. Sci. USA 89: 
10915-10919.) 

40 Teile von Pro t einen, die von den erf indungsgema£en Desaturase- 
Nukleinsauremolekiilen kodiert werden, sind vorzugsweise bio- 
logisch aktive Teile einer der Desaturasen. Wie hier verwendet, 
soil der Begriff "biologisch aktiver Teil einer Desatxirase", 
einen Abschnitt, z.B. eine Domane/ein Motiv, einer Desaturase 

45 lamfassen, der am Stoffwechsel von zxm Aufbau von Zellmembranen 
in Mikroorganismen oder Pflanzen notwendigen Verbindungen oder 
am Transport von Molekiilen tiber diese Membranen teilnehmen kann 
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Oder eine in Tabelle 5 und 6 angegebene AktivitSt aufweist. Zur 
Bestimmung, ob eine Desaturase oder ein biologisch aktiver Teil 
davon am Stof fwechsel von zum Aufbau von ZellmembrcUien in Mikro- 
organismen oder Pflanzen notwendigen Verbindimgen oder am Trans- 
5 port von Molekiilen ilber diese Membranen teilnehmen kann, kann 
ein Test der enzymatischen Aktivitat durchgefiihrt werden. Diese 
Testverfahren, wie eingehend in Beispiel 8 des Beispielteils 
beschrieben, sind dem Fachmann gelSufig. 

10 Zusatzliche Nukleinsaurefragmente, die biologisch aktive 
Abschnitte einer Desaturase kodieren, lassen sich durch 
Isolieriing eines Teils einer der Sequenzen in SEQ ID NO: 1, 3, 
5 oder 11, Exprimieren des kodierten Abschnitt der Desaturase 
Oder des Peptids (z.B. durch rekombinsinte Expression in vitro) 

15 und Bestiramen der Aktivit§t des kodierten Teils der Desaturase 
Oder des Peptids herstellen. 

Die Erfindung umfasst zudem Nukleinsauremolekule, die sich 

von einer der in SEQ ID NO: 1, 3, 5 oder 11 gezeigten Nukleotid- 

20 sequenzen (und Teilen davon) aufgrund des degenerierten 

genetischen Codes unterscheiden und somit die gleiche Desaturase 
kodieren wie diejenige, die von den in SEQ ID NO: 1, 3, 5 oder 11 
gezeigten Nukleotidsequenzen kodiert wird. Bei einer anderen Aus- 
fiihrungsform hat ein erf indvmgsgemaSes isoliertes NxikleinsSure- 

25 molektil eine Nukleotidsequenz, die fOr ein Protein mit einer in 
SEQ ID NO: 2, 4, 6 Oder 12 gezeigten Aminos auresequenz kodiert. 
Bei einer weiteren Ausfxihrungsform kodiert das erf indungsgemaiSe 
Nukleinsauremolekiil ein Vollangen-Desaturase-Protein, das zu 
einer AminosSuresequenz der SEQ ID NO: 2,4, 6 oder 12 (die 

30 von einem in SEQ ID NO: 1, 3, 5" oder 11 gezeigten offenen 

Leseraster kodiert wird) im wesentlichen homolog ist und durch 
gangige Methoden identif izierbar und isolierbar ist. 

ZusStzlich zu den in SEQ ID NO: 1, 3, 5 oder 11 gezeigten 
35 Desaturase-Nukleotidsequenzen erkennt der Fachmann, dass DNA- 
Sequenzpolymorphismen, die zu Anderungen in den Aminosfiure- 
sequenzen der Desaturasen fxihren, innerhalb einer Population 
(z.B. der Phaeodactylxam tricornutum-Population) existieren 
konnen. Diese genetischen Polymorphismen im Desaturase-Gen kQnnen 
40 zwischen Individuen innerhalb einer Population aufgrund von 
nattlrlicher Variation existieren. Wie hier verwendet, bedeuten 
die Begriffe *Gen'' und "rekombinantes Gen" NukleinsauremolekUle 
mit einem offenen Leserahmen, der eine Desaturase, vorzugsweise 
eine Phaeodactylum tricomutum -Desaturase, kodiert. Diese natiir- 
45 lichen Varianten bewirken Oblicherweise eine Varlanz von 1 bis 
5 % in der Nukleotidsequenz des Desaturase-Gens . S&ntliche 
und alle dieser Nukleotidvariationen und daraus resultierende 
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Aminosaurepolymorphismen in der Desaturase, die das Ergebnis 
natQrlicher Variation sind und die funktionelle Aktivitat von 
Desaturasen nicht ver&idem, sollen im Umfang der Erfindung 
enthalten sein. 

5 

Nukleinsauremolekiile, die den natQrlichen Varianten entsprechen, 
\md nicht-Phaeodactylum tricornutum-Homologen, -Derivate und 
-Analoga der Phaeodactylum tricornutum-cDNA konnen auf der 
Grundlage ihrer Homologie zu der hier of fenbarten Phaeodactylum 

10 tricomutum-Desaturase-Nukleinsaure unter Verwendung der Phaeo^ 
dactylum tricomutum-cDNA oder eines Teils davon als Hybridi- 
sierungssonde geraSS Standard-Hybridisierungstechniken unter 
stringenten Hybridisierungsbedingungen isoliert werden. Bei einer 
anderen Ausfiihrungsform ist ein erf indungsgeinaEes isoliertes 

15 NukleinsauremolekQl mindestens 15 Nukleotide lang und hybridi- 
siert unter stringenten Bedingungen mit dem NukleinsauremolekQl , 
das eine Nukleotidsequenz der SEQ ID N0:1, 3, 5 oder 11 umfasst. 
Bei anderen Ausfuhrungsformen ist die NukleinsSure mindestens 25, 
50, 100, 250 oder mehr Nukleotide lang. Der Begriff "hybridisiert 

20 unter stringenten Bedingungen*' , wie hier verwendet, soli Hybridi- 
sierxings- und Waschbedingungen beschreiben, unter denen Nukleo- 
tidsequenzen, die mindestens 60 % homolog zueinander sind, ge- 
wohnlich aneincinder hybridisiert bleiben. Die Bedingungen sind 
vorzugsweise derart/ dass Sequenzen, die mindestens etwa 65 %, 

25 starker bevorzugt mindestens etwa 70 % und noch stcLrker bevor- 
zugt mindestens etwa 75 % oder starker zueinander homolog sind, 
gewohnlich aneinander hybridisiert bleiben. Diese stringenten 
Bedingimgen sind dem Fachmann bekannt und lassen sich in Current 
Protocols in Molecular Biology, John Wiley & Sons, N. Y. (1989), 

30 6.3. 1-6 .3 .6., f inden . Ein bevorzugtes , nicht einschrSnkendes 

Beispiel fiir stringente Hybridisierungsbedingungen sind Hybridi- 
sierungen in 6 x Natriumchlorid/Natriumcitrat (sodium chloride/ 
sodiumcitrate = SSC) bei etwa 45**C, gefolgt von einem oder 
mehreren Waschschritten in 0,2 x SSC, 0,1 % SDS bei 50 bis 65°C. . 

35 Dem Fachmann ist bekannt, dass diese Hybridisierungsbedingungen 
sich je nach dem Typ der Nukleinsaure und, wenn beispielsweise 
organische Losungsmittel vorliegen, hinsichtlich der Temperatur 
und der Konzentration des Puffers unterscheiden. Die Temperatur 
xinterscheidet sich beispielsweise unter "Standard-Hybridi- 

40 sierungsbedingungen" je nach dem Typ der Nukleinsaure zwischen 
42*'C und 58^C in wassrigem Puffer mit einer Konzentration von 0,1 
bis 5 X SSC (pH 7,2). Falls organisches LSsungsmittel im oben- 
genannten Puffer vorliegt, z\m Beispiel 50 % Formamid, ist die 
Temperatur \inter Standardbedingxmgen etwa 42 °C. Vorzugsweise sind 

45 die Hybridisierungsbedingungen fiir DNA:DNA-Hybride zum Beispiel 
0,1 X SSC und 20**C bis 45°C, vorzugsweise zwischen SCC und 45**C. 
Vorzugsweise sind die Hybridisierungsbedingungen ftir DNA;RNA- 
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Hybride zum Beispiel 0,1 x SSC \md 30°C bis 55°C, vorzugsweise 
zwischen 45**C \md 55**C. Die vorstehend genannten Hybridisierungs- 
. temperaturen sind beispielsweise fvir eine NukleinsSure mit etwa 
100 bp (= Basenpaare) Ltoge und einem G + C-Gehalt von 50 % 
5 in Abwesenheit von Fonnamid bestimmt, Der Fachmann weifi, wie 
die erforderlichen Hybridisierungsbedingungen anhand von Lehr- 
biichern, wie dem vorstehend erwcLhnten oder aus den folgenden 
Lehrbuchern Sambrook et al . , "Molecular Cloning" , Cold Spring 
Harbor Laboratory, 1989; Haines und Higgins (Hrsgb.) 1985, 
10 "Nucleic Acids Hybridization: A Practical Approach", IRL Press at 
Oxford University Press, Oxford; Brown (Hrsgb.) 1991, "Essential 
Molecular Biology: A Practical Approach", IRL Press at Oxford 
University Press, Oxford, bestimmt werden kSnnen. 

15 Vorzugsweise entspricht ein erfindungsgemcLSes isoliertes Nuklein- 
sauremolektil , das unter stringenten Bedingungen an eine Sequenz 
der SEQ ID N0:1, 3, 5 oder 11 hybridisiert , einem natUrlich vor- 
kommenden Nukleins^tiremolekttl. Wie hier verwendet, betrifft ein 
"nattirlich vorkommendes" Nukleinsauremolektil ein RNA- oder DNA- 

20 Molelcttl mit einer Nukleotidsequenz , die in der Natxu: vorkommt 

(z.B. ein natttrliches Protein kodiert) . Bei einer Aus fiihrungs form 
kodiert die Nukleinsaure eine naturliche vorkommendes Phyaeo- 
dactylum tricornutum-Desaturase. 

25 Zusatzlich zu natilrlich vorkommenden Varianten der Desaturase- 
sequenz, die in der Population existieren k5nnen, erkennt der 
Fachmann ferner, dass auch Anderungen durch Mutation in eine 
Nukleotidsequenz der SEQ ID NO: 1, 3, 5 oder 11 eingebracht 
werden konnen, was zu Anderungen der AminosSuresequenz der 

30 kodierten Desaturase fiihrt, ohne dass die Funktionsfahigkeit 
des Desaturaseproteins beeintrSchtigt wird. Beispielsweise 
lassen sich Nukleotidsusbtitutionen, die an "nicht-essentiellen" 
Aminosaureresten zu Aminosaxiresubstitutionen ftihren, in einer 
Sequenz der SEQ ID NO; 2, 4, 6 oder 12 herstellen. Ein "nicht- 

35 essentieller" AminosSurerest ist ein Rest, der sich in einer 

Wildtyp-Desaturasequenz einer der Desaturasen (SEQ ID NO: 2, 4, 6 
Oder 12) verSndern ISsst, ohne dass die Aktivitat der Desaturase 
verSndert das heifit wesentlich reduziert wird, wohingegen ein 
"essentieller" AminosSurerest fiir die Desaturaseaktivitat 

40 erforderlich ist. Andere AminosSurereste (z.B. diejenigen, die 
in der DomSne mit Desaturaseaktivitat nicht konserviert oder 
lediglich semikonserviert sind) k6nnen jedoch fUr die Aktivitat 
nicht essentiell sein xind lassen sich somit verandem, ohne dass 
die Desaturaseaktivitat verandert wird. 
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Folglich betrifft ein weiterer Aspekt der Erfindung Niiklein- 
sauremolekttle, die Desaturasen kodieren, die ver&iderte Amino- 
sSurereste enthalten, die fdr die Desaturaseaktivitat nicht 
essentiell sind. Diese Desat\irasen unterscheiden sich in der 
5 Aminosauresequenz von einer Sequenz in SEQ ID NO: 2, 4, 6 oder 
12 xind behalten dennoch zumindest eine der hier beschriebenen 
Desaturaseaktivitaten, Das isolierte Nukleinsauremolekdl umfasst 
bei einer Ausfiihriingsform eine Nukleotidsequenz, die ein Protein 
kodiert, wobei das Protein eine AminosSuresequenz mit mindestens 

10 etwa 50 % Homologie zu einer Aminosauresequenz der SEQ ID NO: 2, 
4, 6 Oder 12 \mfasst und am Stoffwechsel von zum Aufbau von Zell- 
membranen in Phaeodactylum tricomutum notwendigen Verbindungen 
Oder am Transport von Molekiilen tiber diese Membranen teilnehmen 
kann. Das von dem Nukleins^uremolekiil kodierte Protein ist 

15 vorzugsweise mindestens etwa 50 bis 60 % homolog zu einer der 
Sequenzen in SEQ ID NO: 2, 4, 6 oder 12 starker bevorzugt min- 
destens etwa 60 bis 70 % homolog zu einer der Sequenzen in 
SEQ ID NO: 2, 4, 6 oder 12 noch starker bevorzugt mindestens 
etwa 70 bis 80 %, 80 bis 90 %, 90 bis 95 % homolog zu einer 

20 der Sequenzen in SEQ ID NO: 2, A, 6 oder 12 und am stSrksten 
bevorzugt mindestens etwa 96 %, 97 %, 98 % oder 99 % homolog 
zu einer der Sequenzen in SEQ ID NO: 2, 4, 6 oder 12. 

Zur Bestimmung der prozentualen Homologie von zwei AminosSure- 

25 sequenzen (z.B. einer der Sequenzen der SEQ ID NO: 2, 4, 6 oder 
12 und einer mutierten Form davon) oder von zwei Nukleinsauren 
werden die Sequenzen zum Zweck des optimalen Vergleichs unter- 
einander geschrieben (z.B. k5nnen Liicken in die Sequenz eines 
Proteins oder einer NukleinsSure eingefiigt werden, um ein opti- 

30 males Alignment mit dem anderen Protein oder der anderen Nuklein- 
saure zu erzeugen) . Die Aminosaurereste oder Nukleotide an den 
entsprechenden AminoscLurepositionen oder Nukleotidpositionen 
werden dann verglichen. Wenn eine Position in einer Sequenz (z.B. 
einer der Sequenzen der SEQ ID NO: 2, 4, 6 oder 12) durch den 

35 gleichen Aininosaurerest oder das gleiche Nukleotid wie die ent- 
sprechende Stelle in der anderen Sequenz (z.B. einer mutierten 
Form der aus SEQ ID NO: 2, A, 6 oder 12 ausgewahlten Sequenz) 
belegt wird, dann sind die Molekiile an dieser Position homolog 
(d.h. AminosSure- oder Nukleinsaure- " Homologie " , wie hier ver- 

40 wendet, entspricht Aminos^ure- oder Nukleinsaure-^'Identitat" ) . 
Die prozentuale Homologie zwischen den beiden Sequenzen ist 
eine Funktion der Anzahl an identischen Positionen, die den 
Sequenzen gemeinsam sind (d.h. % Homologie = Anzahl der 
identischen Positionen/Gesamtanzahl der Positionen x 100) . 

45 Die Begriffe Homologie und Identitat sind damit als Synonym 
anzusehen • 
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Ein isoliertes r^xokleinsauremoleWil, das eine Desaturase kodiert, 
die zu einer Proteinsequenz der SEQ ID NO: 2, 4, 6 oder 12 homo- 
log ist, kann durch Einbringen einer oder mehrerer Nukleotid- 
substitutionen, -additionen oder -deletionen in eine Nukleotid- 
5 sequenz der SEQ ID NO: 1, 3, 5 oder 11 erzeugt werden, so 
dass eine oder mehrere Aminosauresiibstitutionen, -additionen 
Oder -deletionen in das kodierte Protein eingebracht werden. 
Mutationen konnen in eine der Sequenzen der SEQ ID NO: 1, 3, 5 
Oder 11 durch Standardtechniken, wie stellenspezif ische Muta- 

10 genese und PCR-vermittelte Mutagenese, eingebracht werden. 
Vorzugsweise werden konservative Aitiinosauresubstitutionen an 
einer oder mehreren der vorhergesagten nicht-essentiellen Amino- 
s^ureresten hergestellt. Bei einer "konservativen AminoscLure- 
substitution" wird der AminosSurerest gegen einen AminoscLurerest 

15 mit einer Shnlichen Seitenkette ausgetauscht . Im Fachgebiet 
sind Familien von Aminos aureres ten mit ahnlichen Seitenketten 
definiert worden. Diese Familien timfassen AminosSuren mit 
basischen Seitenketten (z.B. Lysin, Arginin, Histidin) , sauren 
Seitenketten (z.B. AsparaginsSure, Glutaminsaure) , ungeladenen 

20 polaren Seitenketten (z.B. Glycin, Asparagin, Glutamin, Serin, 
Threonin, Tyrosin, Cystein) , unpolaren Seitenketten, (z.B. 
Alanin, Valin, Leucin, Isoleucin, Prolin, Phenylalanine 
Methionin, Tryptophan), beta-verzweigten Seitenketten (z.B. 
Threonin, Valin, Isoleucin) und aromatischen Seitenketten (z.B. 

25 Tyrosin, Phenylalanine Tryptophan, Histidin) . Ein vorhergesagter 
nicht-essentieller Aminosaurerest in einer Desaturase wird somit 
vorzugsweise durch einen anderen AminoscLurerest aus der gleichen 
Seitenkettenfamilie ausgetauscht, Altemativ kSimen bei einer 
cuideren Aus fuhrungs form die Mutationen zufallsgemSlS liber die 

30 gesamte oder einen Teil der Desaturase-kodierenden Sequenz ein- 
gebracht werden, z.B. durch Sattigungsmutagenese, und die resul- 
tierenden Mutant en konnen nach der hier beschriebenen Desaturase- 
Aktivitat durchmustert werden, um Mutanten zu identifizieren, 
die Desaturaseaktivitat beibehalten. Nach der Mutagenese einer 

35 der Sequenzen der SEQ ID NO: 1, 3, 5 oder 11 kann das kodierte 
Protein rekombinant exprimiert werden, und die AktivitSLt des 
Proteins kann z,B. unter Verwendung der hier beschriebenen Tests 
(siehe Beispielteil) bestimmt werden. 

40 Zusatzlich zu den Nukleinsauremolekaien, welche die vorstehend 
beschriebenen Desaturasen kodieren, betrifft ein weiterer Aspekt 
der Erfindung isolierte NukleinseLuremolekale, die "Antisense'* 
zu den erf indungsgemSSen NukleinsSuresequenzen sind. Eine "Anti- 
sense "-NukleinsSure umfasst eine Nukleotidsequenz, die zu einer 

45 " Sense ''-Nukleinsaure, welche ein Protein kodiert, komplementSr 
ist, z.B. komplementar zum kodierenden Strang eines doppel- 
str&igigen cDNA-Molekais oder komplementar zu einer mRNA-Sequenz . 
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Eine Antisense-Nukleinsaure kann folglich uber Wasserstof f- 
brtickenbindungen an eine Sens e-Nukleins Sure binden. Die Anti- 
sense-Nukleinsa\ire kann zu eineiti gesamten Desaturase-kodierenden 
Strang oder nur zu einem Tail davon koitiplementSr sein. Bei einer 
5 Ausfuhrungsform ist ein Antisense-NukleinsSuremoleklil "Antisense" 
zu einem "kodierenden Bereich" des kodierenden Strangs einer 
Nukleotidsequenz, die eine Desaturase kodiert. Der Begriff 
"kodierender Bereich" betrifft den Bereich der Nukleotidsequenz, 
der Codons umfasst, die in Aminosaurereste translatiert werden 

10 (z.B. den gesamten kodierenden Bereich, der mit dem Stopcodon 
beginnt und endet, d.h. dem letzten Codon vor dem Stopcodon) . 
Bei einer weiteren Ausfuhrungsform ist das Antisense-Nuklein- 
sSuremolektll "Antisense" zu einem "nicht -kodierenden Bereich" 
des kodierenden Strangs einer Nukleotidsequenz, die Desaturase 

15 kodiert. Der Begriff ^nicht-kodierender Bereich' betrifft 5'- 
\md 3'-Sequenzen, die den kodierenden Bereich flankieren und 
nicht in AminosSuren translatiert werden (d.h. die man auch 
als 5'- und 3 '-untranslatierte Bereiche bezeichnet) . 

20 Unter Voraussetzung der hier offenbarten Desaturase-kodierenden 
Sequenzen des kodierenden Stranges (z.B. die in SEQ ID NO: 1, 
3, 5 Oder 11 dargestellten Sequenzen) kSnnen erf indungsgemaiSe 
Antisense-Nukleinsauren gemafi den Regeln der Watson-Crick-Basen- 
paarung gestaltet werden. Das Antisense-NukleinsauremolekUl kann 

25 komplementar zum gesamten kodierenden Bereich von Desaturase-mRNA 
sein, ist aber starker bevorzugt ein Oligonukleotid, das nur zu 
einem Teil des kodierenden oder nicht -kodierenden Bereichs von 
Desaturase-mRNA "Antisense" ist. Das Antisense-Oligonukleotid 
kann z.B. zu dem Bereich, der die Translationsstartstelle von 

30 Desaturase-mRNA umgibt, komplement^r sein. Ein Antisense-Oligo- 
nukleotid kann z.B. etwa 5, 10, 15, 20, 25, 30, 35, 40, 45 oder 
50 und mehr Nukleotide lang sein. Eine erf indungsgemafie Anti- 
sense-Nukleinsaure kann unter Verwendung chemischer Synthese \ind 
enzymatischer Ligationsreaktionen mittels im Fachgebiet bekannter 

35 Verfahren konstruiert werden. Eine Antisense-Nukleinsaure (z.B. 
ein Antisense-Oligonukleotid) kann z.B. chemisch synthetisiert 
werden, wobei natttrlich vorkommende Nukleotide oder verschiedent- 
lich modifizierte Nukleotide verwendet werden, die so gestaltet 
sind, dass sie die biologische Stabilitat der Molekiile erhohen 

40 Oder die physikalische Stabilitat des zwischen der Antisense- und 
der Sense-Nukleinsaure gebildeten Duplexes erhdhen, beispiels- 
weise k5nnen Phosphorthioat-Derivate und acridinsubstituierte 
Nukleotide verwendet werden. Beispiele filr modifizierte Nukleo- 
tide, die zur Erzeugung der Antisense-NukleinsSure verwendet 

45 werden konnen, sind u.a. 5-Fluoruracil, 5-Bromuracil, 5-Chlor- 
uracil, 5-Ioduracil, Hypoxcuithin, Xanthin, 4-Acetylcytosin, 
5- ( Carboxyhydroxylmethyl ) uracil , 5-Carboxymethyla3ninomethyl-2- 
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thio\iridin , 5 -Carboxymethylaminomethyluracil , Dihydrouracil , 
Beta-D-Galactosylqueosin, Inosin, N6-Isopentenyladenin, 1-Methyl- 
guanin, 1-Methylinosin, 2, 2-Diinethylguanin, 2-Methyladenin, 
• 2-Methylguanin, 3-Methylcytosin, S-MethylcytosiU/ N6-Adenin, 
5 7-Methylguanin, S-Methylaminomethyluracil, S-Methoxyaminomethyl- 
2-thiouracil , Beta-D-Mannosylqueosin, 5 ' -Methoxycarboxymethyl- 
ixracil, 5-Methoxyuracil, 2-Methylthio-N6-isopentyladenin, Uracil- 
5-oxyessigsaure (v) , Wybutoxosin, Desaturaseudouracil, Queosin, 
2-Thiocytosin, 5-Methyl-2-thiouracil, 2-Thiouracil , 4-Thiouracil, 

10 5-Methyluracil, Uracil-S-oxyessigsSuremethylester , Uracil-5- 
oxyessigsSure (v) , 5-Methyl-2-thiouracil, 3- {3-Amino-3-N-2- 
carboxypropyl)uracil, (acp3)w iind 2, 6~Diaminopiirin. Die Anti- 
sense-Nukleins^ure kann alternativ biologisch unter Verwendung 
eines Express ionsvektors hergestellt werden, in den eine Nuklein- 

15 saure in Antisense-Richtung subkloniert worden ist (d.h. RNA, 
die von der eingebrachten NukleinsSure transkribiert wird, ist 
zu einer ZielnukleinsSure von Interesse in Antisense-Richtung 
orientiert, was im nachstehenden Unterabschnitt weiter 
beschrieben ist) . 

20 Die erfindungsgemcLfien Antisense-Nukleinsauremolektile werden 

tiblicherweise an eine Zelle verabreicht oder in situ erzeugt, so 
dass sie mit der zellularen mRNA und/oder der genomischen DNA, 
die eine Desatiirase kodiert, hybridisieren oder daran binden, 
um dadurch die Expression des Proteins, z.B. durch Hemmung der 

25 Transkription \ind/oder Translation, zu hemmen. Die Hybridisierung 
kann durch herk^mmliche Nukleotidkomplementarit^t unter Bildung 
eines stabilen Duplexes oder z.B. im Fall eines Antisense- 
Nukleinsaiiremolekais, das DNA-Duplices bindet, durch spezifische 
Wechselwirkungen in der grofien Furche der Doppelhelix erfolgen. 

30 Das Antisense-Molekiil kann so modifiziert sein, dass es spezi- 
fisch an einen Rezeptor oder an ein auf einer ausgewahlten Zell- 
oberflache exprimiertes Antigen bindet, z.B. durch Binden des 
Antisense-NukleinsSuremolektlls an ein Peptid oder einen Anti- 
k5rper, das/der an einen Zelloberf lachenrezeptor oder ein Antigen 

35 bindet. Das Antisense-Nukleinsauremolekul kann auch unter Ver- 
wendung der hier beschriebenen Vektoren den Zellen zugefUhrt 
werden. Zur Erzielung ausreichender intrazellularer Konzentra- 
tionen der T^tisense-Molekiile sind Vektorkonstrukte, in denen 
sich das Antisense-NukleinsSuremolekiil imter der Kontrolle eines 

40 starken prokaryotischen, viralen oder eukaryotischen, einschliefi- 
lich pflanzlichen. Promoters befindet, bevorzugt. 

Bei einer weiteren Ausfuhrungsform ist das erf indungsgemSSe Anti- 
sense-NukleinsSuremolekQl ein a-anomeres Nukleinsauremolekiil. Ein 
45 a-anomeres NukleinsSuremolekQl bildet spezi£ische doppelstr^ngige 
Hybride mit komplementSrer RNA, wobei die Strange im Gegensatz zu 
gewahnlichen P-Einheiten parallel zueinander verlaufen. (Gaultier 
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et al. (1987) Nucleic Acids Res. 15:6625-6641). Das Antisense- 
Nukleinsauremolekiil kann zudem ein 2'-o-Methylribonukleotid 
(Inoue et al. (1987) Nucleic Acids Res. 15:6131-6148) Oder 
ein chimSres RNA-DNA-Analogon (Inoue et al. (1987) FEBS Lett. 
5 215:327-330) uiafassen. 

Bei einer weiteren Ausftlhrungsfonn ist eine erfindungsgeinafie 
Antisense-Nukleins^ure ein Ribozym. Ribozyme sind katalytische 
RNA-MolekUle mit Ribonukleaseaktivitat , die eine einzelstrangige 

10 Nukleinsaure, wie eine itiRNA, spalten konnen, zu der sie einen 
komplementaren Bereich haben. Somit kdnnen Ribozyme (z.B. Hammer- 
head-Ribozyme (beschrieben in Haselhoff und Gerlach (1988) Nature 
334:585-591)) zur katalytischen Spaltung von Desaturase-mRNA- 
Transkripten verwendet werden, urn dadurch die Translation von 

15 Desaturase-mRNA zu hemmen. Ein Ribozym mit SpezifitSt fClr eine 
Desaturase-kodierende Nukleins^ure kann auf der Basis der Nukleo- 

. . tidsequenz einer der in SEQ ID NO: 1, 3, 5 oder 11 offenbarten 
besaturase-cDNA (d.h. oder auf der Basis einer gemMS den in 
dieser Erfindung gelehrten Verfahren zu isolierenden heterologen 

20 Sequenz gestaltet werden. Beispielsweise kann ein Deri vat einer 
Tetrahymena-L-19-IVS-RNA konstruiert werden, wobei die Nukleotid- 
sequenz der aktiven Stelle komplementar zu der Nukleotidsequenz 
ist, die in einer Desaturase-kodierenden mRNA gespalten werden 
soli. Siehe z.B. Cech et al., US-Patent Nr. 4,987,071 xnxd Cech 

25 et al., US-Patent Nr. 5,116,742. Altemativ kann Desaturase-mRNA 
zur Selektion einer katalytischen RNA mit einer spezifischen 
Ribonukleaseaktivitat aus einem Pool von RNA-Molekulen verwendet 
werden. Siehe z.B. Bartel, D. , und Szostak, J.W. (1993) Science 
261:1411-1418, 

30 

Alternativ lasst sich die Desaturase-Gen-Expression hemmen, 
indem Nukleotidsequenzen, die komplementar zxim regulator ischen 
Bereich einer Desaturase-Nukleotidsequenz (z.B. einem Desaturase- 
Promotor und/oder -Enhancer) sind, so dirigiert werden, dass 
35 Dreifachhelix-Strukturen gebildet werden, welche die Transkrip- 
tion eines Desaturase-Gens in Zielzellen hemmen. Siehe allgemein 
Helene, C. (1991) Anticancer Drug Res. 6(6) 569-84; Helene, C, 
et al. (1992) Ann. N. Y. Acad. Sci. 660:27-36; und Maher. L.J, 
(1992) Bioassays 14(12) : 807-815. 

40 

B. Genkonstrukt (= Nukleinsaurekonstrukt, -fragment oder 
Expressionskassette ) 

Unter der erf indungsgemaEen Expressionskassette sind die in 
45 SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5 oder SEQ ID NO: 11 

genannten Sequenzen, die sich als Ergebnis des genetischen Codes 
und/oder deren funktionellen oder nicht funktionellen Derivate 
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2U verstehen, die mit einem oder mehreren Regulationssignalen 
vorteilhafterweise zur Erh5hiing der Genexpression funktionell 
verknttpft vAirden land welche vorteilhaft die Expression der codie- 
renden Sequenz in der Wirtszelle steuem. Diese regulatorischen 
5 Sequenzen sollen die gezielte Expression der Gene und der 

Proteinexpression ermOglichen* Dies kann beispielsweise je nach 
Wirtsorganismus bedeuten, dass das Gen erst nach Induktion 
exprimiert und/oder iiberexprimiert wird, oder dass es sofort 
exprimiert und/oder uberexprimiert wird. Beispielsweise handelt 

10 es sich bei diesen regulatorischen Sequenzen \m Sequenzen an 
die Induktoren oder Repressoren binden und so die Expression der 
NukleinsSure regulieren. Zusatzlich zu diesen neuen Regulations- 
sequenzen oder anstelle dieser Sequenzen kann die natiirliche 
Regulation dieser Sequenzen vor den eigentlichen Strukturgenen 

15 noch vorhanden sein und gegebenenfalls genetisch ver&adert worden 
sein, so dass die nattlrliche Regulation ausgeschaltet und die 
Expression der Gene erh6ht wurde. Das Genkonstrukt kann aber 
auch einfacher aufgebaut sein, das heifit es wurden keine zusStz- 
lichen Regulationssignale vor die Nukleinsauresequenz oder 

20 dessen Derivate inseriert und der natiirliche Promoter mit seiner 
Regulation wurde nicht entfemt. Stattdessen wurde die nattirliche 
Regulationssequenz so mutiert, dass keine Regulation mehr erfolgt 
xmd/oder die Genexpression gesteigert wird. Diese ver^derten 
Promotoren konnen in Form von Teilsequenzen (= Promoter mit 

25 Teilen der erf indtingsgemafien Nukleinsauresequenzen) auch allein 
vor das natUrliche Gen zur Steigerung der Aktivitat gebracht 
werden. Das Genkonstrukt kann aufierdem vorteilhafterweise auch 
eine oder mehrere sogenannte ^'enhancer Seqaenzen" fimktionell 
verkniipft mit dem Promoter enthalten, die eine erh5hte Expression 

30 der Nukleinsauresequenz ermOglichen. Auch am 3'-Ende der DNA- 
Sequenzen kOnnen zusStzliche vorteilhafte Sequenzen inseriert 
werden wie weitere regulatorische Elemente oder Terminatoren , 
Die A-5-Desaturase-/A-6-Desaturase und/oder A-12-Desaturasegene 
k6nnen in einer oder mehreren Kopien in der Expressionskassette 

35 (= Genkonstrukt) enthalten sein. 

Die regulatorischen Sequenzen bzw. Faktoren kdnnen dabei wie 
oben beschrieben vorzugsweise die Genexpression der eingefOhrten 
Gene positiv beeinflussen und dadurch erhQhen. So kann eine Ver- 
40 starkving der regulatorischen Elemente vorteilhafterweise auf der 
Transkriptionsebene erfolgen, indem starke Transkriptionssignale 
wie Promotoren und/oder "Enheuicer" verwendet werden. Dcuieben ist 
aber auch eine Verst^rkung der Translation m6glich, indem bei- 
spielsweise die Stabilitat der mRNA verbessert wird. * 

45 
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Eine weitere Ausfuhrungsform der Erfindxmg sind ein Oder mehrere 
Genkonstrukte, die eine oder mehrere Sequenzen enthalten, die 
durch Seq ID NO: 1, 3/ 5/ 1 , 9 oder 11 definiert sind \md gem. 
SEQ ID NO: 2, 4, 6, 8, 10 oder 12 Polypeptide kodieren. Dabei 
5 stammen SEQ ID NO: 1, 3, 5, 7 und 11 von Desaturasen w3.hrend 
SEQ ID NO: 9 fiir eine Elongase codiert* Desat\irasen codierende 
Enzyme, die eine Doppelbindung in A-5-, A-6- oder A-12 -Position 
einftihren, wobei das Substrat ein, zwei, drei oder vier Doppel- 
bindungen aufweisen. Die in SEQ ID NO: 9 dargestellte Sequenz 

10 codiert f\ir eine EnzymaktivitSt, die eine Fettsaure lam min- 
destens zwei Kohlenstof fatome verlangert sowie ihre Homologen, 
Derivate oder Analoga, die funktionsfShig mit einem oder 
mehreren Regulationssignalen, vorteilhaf terweise zur Steigerung 
der Genexpression, verbunden sind. Beispiele fiir diese Regula- 

15 t ions sequenzen sind Seq]j.Qnzent an die Induktoren oder Repressoren 
binden und so die Expression der NukleinsSure regulieren, Zusatz- 
lich zu diesen neuen Regulationssequenzen kann die natarliche 
Regulation dieser Sequenzen vor den eigentlichen Strukturgenen 
noch vorhanden sein und, wenn geeignet, genetisch modifiziert 

20 worden sein, so dass die natOrliche Regulation ausgeschaltet 
worden ist imd die Expression der Gene gesteigert worden ist. 
Das Genkonstrukt kann jedoch auch eine einfachere Stiruktur haben, 
d.h. dass keine zus^tz lichen Regulationssignale vor der Sequenz 
SEQ ID NO: 1, 3, 5 oder 11 oder ihren Homologen inseriert worden 

25 sind und der natiirliche Promotor mit seiner Regulation nicht 
deletiert worden ist. Statt dessen ist die naturliche Regula- 
tionssequenz so mutiert worden, dass keine Regulation mehr statt- 
findet und die Genexpression verst^rkt ist. Das Genkonstrukt 
kann auSerdem vorteilhaf teinveise eine oder mehrere sogenannte 

30 Enhancer-Sequenzen, die fiinktionsfahig mit dem Promotor verbunden 
sind \md die gesteigerte Expression der Nukleinsauresequenz 
ermSglichen, umfassen. Es ist auch moglich, am 3'-Ende der DNA- 
Sequenzen zusStzlich vorteilhafte Sequenzen zu inserieren, bei- 
spielsweise weitere Regulations element e oder Terminatoren. Die 

35 Desaturasegene \ind das Elongasegen konnen im Genkonstrukt in 
einer oder mehreren Kopien vorliegen, Sie kSnnen in einem 
Genkonstrukt oder mehreren Genkonstrukten vorliegen. Dieses 
Genkonstrukt oder die Genkonstrukt e kdnnen zusammen im Wirts- 
organismus exprimiert werden, Dabei kann das Genkonstrukt oder 

40 die Genkonstrukte in einem oder mehreren Vektoren inseriert sein 
\md frei in der Zelle vorliegen oder aber im Genom inseriert 
sein, Es ist vorteilhaf t fCb: die Insertion weiterer Gene in 
Organismen, wenn weitere Gene im Genkonstrukt vorliegen, 

45 Vorteilhafte Regulationssequenzen ftir das neue Verfahren liegen 
beispielsweise in Promo toren vor, wie dem cos-, tac-, trp-, tet-, 
trp-tet-, Ipp-, lac-, Ipp-lac-, lacl^"* T7-, T5-, T3-, gal-, trc-, 
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ara-, SP6-, X-Pfe-* oder X-PL-Promotor und werden vorteilhaf terweise 
in Gram-negativen Bakterien angewendet. Wei t ere vorteilhafte 
Regulationssequenzen liegen beispielsweise in den Gram-positiven 
Promotoren amy und SP02, in den Hefe- oder Pilzpromotoren ADCl, 
5 MFa, AC, P-60, CYCl, GAPDH, TEF, rp28, ADH oder in den Pflanzen- 
promotoren CaMV/35S [Franck et al.. Cell 21 (1980) 285-294], 
PRPl [Ward et al.. Plant. Mol, Biol. 22 (1993)], SSU, OCS, lib4, 
usp, STLSl, B33, nos oder im Ubiquitin- oder Phaseolin-Promotor 
vor. In diesem Zusammenhang vorteilhaft sind ebenfalls induzier- 

10 bare Promotoren, wie die in EP-A-0 388 186 ( Benzyl sulfonamid- 
induzierbar) , Plant J. 2, 1992:397-404 (Gatz et al., Tetra- 
cyclin-induzierbar) , EP-A-0 335 528 (Abzisinsaure-induzierbar) 
Oder WO 93/21334 (Etlianol- oder Cyclohexenol-induzierbar) be- 
sclirielDenen Promotoren. Weitere geeignete Pf lanzenpromotoren sind 

15 der Promotor von cytosolischer FBPase oder der ST-LSI-Promotor 
der Kartoffel (Stockhaus et al., EMBO J. 8, 1989, 2445), der 
Phosplioribosylpyrophosphatamidotransferase-Promotor aus Glycine 
max (Genbank-Zugangsnr. U87999) oder der in EP-A-0 249 676 
bescliriebene nodienspezifisclie Promotor. Besonders vorteilhafte 

20 Promotoren sind Promotoren, welclxe die Expression in Geweben 

ermOglichen, die an der Fettsaurebiosynthese beteiligt sind. Ganz 
besonders vorteilhaft sind samenspezifische Promotoren, wie der 
ausftLhrnngsgemSfie USP Promotor aber auch andere Promotoren wie 
der LeB4- (Baeumlein et al.. Plant J., 1992, 2 (2) (2) : 233-239) , 

25 DC3 (Thomas, Plant Cell 1996, 263:359-368), Phaseolin- oder 
Napin-Promotor . Weitere besonders vorteilhafte Promotoren 
sind samenspezifische Promotoren, die fiir monokotyle oder 
dikotyle Pflanzen vetwendet werden konnen Tind in US 5,608,152 
(Napin-Promotor aus Raps), WO 98/45461 (Oleosin- Promotor aus 

30 Arobidopsis) , US 5,504,200 (Phaseolin-Promotor aus Phaseolus 
vulgaris) , WO 91/13980 (Bce4-Promotor aus Brassica) , von 
Baeumlein et al.. Plant J,, 1992, 2 (2):233-239 (LeB4- 
Promotor aus einer Leguminose) beschrieben sind, wobei sich 
diese Promotoren f\ir Dikotyledonen eignen. Die folgenden 

35 Promotoren eignen sich beispielsweise fiir Monokotyledonen lpt-2- 
oder Ipt-l-Promotor aus Gerste (WO 95/15389 und WO 95/23230) , 
Hordein-Promotor aus Gerste und andere, in WO 99/16890 
bescliriebene geeignete. Promotoren. 

40 Es ist im Prinzip moglich, alle natiirlichen Promotoren mit ihren 
Regulationssequenzen, wie die oben genannten, f<lr das neue Ver- 
fahren zu verwenden. Es ist ebenfalls m6glich und vorteilhaft, 
zusSLtzlich synthetische Promotoren zu verwenden. 

45 Das Genkonstriikt kann, wie oben beschrieben, auch weitere Gene 
umfassen, die in die Organismen eingebracht werden sollen. Es ist 
mSglich und vorteilhaft, in die Wirtsorganismen Regulationsgene, 
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wie Gene fiir Induktoren, Repressoren oder Enzyme, welche durch 
ihre EnzymaktlvitUt In die Regulation elnes oder mehrerer Gene 

eines Biosynthesewegs eingreifen, einziibringen und darin zu 
exprimieren . Diese Gene kSnnen heterologen oder homologen 
5 Ursprungs sein. Weiterhin k5nnen vorteilhaft im NukleinsSurekon- 
strukt bzw. Genkonstrukt weitere Biosynthesegene des Fettsaure- 
oder Lipidstof fwechsels enthalten sein oder aber diese Gene 
kSnnen auf einem weiteren oder mehreren weiteren Nukleinsaure- 
konstrukten liegen. Vorteilhaft werden als Biosynthesegene des 

10 Fettsaure- oder Lipidstof fwechsels ein Gen ausgewShlt aus der 
Gruppe Acyl-CoA-Dehydrogenase(n) , Acyl-ACP[= acyl carrier 
protein] -Desaturase (n) , Acyl-ACP-Thioesterase (n) , Fettsaure-Acyl- 
Transf erase (n) , Fettsaure- Synthase (n) , Fettsaure-Hydroxylase (n) , 
Acetyl-Coenzym A-Carboxylase(n) , Acyl-Coenzym, A-Oxidase (n) , 

15 Fettsaure-Desaturase(n) , FettsSure-Acetylenasen, Lipoxygenasen, 
Triacylglycerol-Lipasen, Allenoxid-Synthasen, Hydroperoxid-Lyasen 
oder Fettsaure-Elongase(n) oder deren Kombinationen verwendet. 

Genkonstrukte \aafassen vorteilhafterweise zur Expression der 
20 anderen vorliegenden Gene weitere 3'- und/oder 5 ' -terminal e 
Regulationssequenzen zur Steigerung der Expression, die in 
Abhangigkeit vom gewShlten Wirtsorganismus und dem Gen oder 
den Genen fiir die optimale Expression ausgewShlt werden. 
Diese Regulationssequenzen sollen, wie oben erwahnt, die 
25 spezifische Expression der Gene und die Proteinexpression 
ermoglichen. Dies kann je nach dem Wirtsorganismus beispiels- 
weise bedeuten, dass das Gen nur nach Induktion exprimiert oder 
tlberexprimiert wird oder dass es sofort exprimiert und/oder 
tiberexprimiert wird. 

30 

Die Regulationssequenzen oder -faktoren konnen auEerdem vorzugs- 
weise eine vorteilhafte Wirkung auf die Expression der ein- 
gebrachten Gene haben und diese somit steigern. Auf diese Weise 
ist es moglich, dass die Regulationselemente unter Verwendung 
35 starker Transkriptionssignale, wie Promotoren und/oder Enhancer, 
vorteilhafterweise auf Transkriptionsebene verstSrkt werden, Es 
ist jedoch weiterhin auch m6glich, die Translation zum Beispiel 
durch Verbesserung der. roRNA-StabilitSt zu verstarken. 

40 C. Rekombinante Expressionsvektoren und Wirtszellen 

Ein weiterer Aspekt der Erfindung betrifft Vektoren, vorzugs- 
weise Expressionsvektoren, die eine Nukleinsaure enthalten, 
die eine Desaturase allein (oder einen Teil davon) oder ein 
45 unter Punkt b beschriebenes Nukleinsaurekonstrukt in dem die 
erfindtingsgemaiSe NukleinsSure allein oder in Kombination mit 
weiteren Blosynthesegenen des Fettsaure- oder Lipidstof fwechsels 
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wie Desaturaseh bder Elongasen enthalten ist. Wie hier verwendet, 
betrifft der Begriff "Vektor" ein NukleinsSluremolekiil, das eine 
cindere NukleinsS.ure transportieren kann, an welche es gebunden 
ist. Ein Vektortyp ist ein ''Plasmid" , was fiir eine zirkulare 
5 doppelstrangige DNA-Schleife steht, in die zusSLtzlichen DNA- 
Segmente ligiert werden k6nnen. Ein weiterer Vektortyp ist 
ein viraler Vektor, wobei zusStzliche DNA-Segmente in das 
virale Genom ligiert werden konnen. Bestiirante Vektoren k6nnen 
in einer Wirtszelle, in die sie eingebracht worden sind, 

10 autonom replizieren (z.B. Bakterienvektoren mit bakteriellem 
Replikationsur sprung und episomale SSugervektoren) . Andere 
Vektoren (z.B. nicht-episomale Saugervektoren) werden beiiti 
Einbringen in die Wirtszelle in das Genom einer Wirtszelle 
integriert xind dadurch zusammen mit dem Wirtsgenom repliziert. 

15 Zudem kSnnen bestiirante Vektoren die Expression von Genen, mit 
denen sie fimktionsfShig verbunden sind, steuem. Diese Vektoren 
werden hier als *Expressionsvektoren" bezeichnet. GewShnlich 
haben Expressionsvektoren, die fiir DNA-Rekombinationstechniken 
geeignet sind, die Form von Plasmiden. In der vorliegenden 

20 Beschreibung k6nnen "Plasmid" und "Vektor" austauschbar ver- 
wendet werden, da das Plasmid die am haufigsten verwendete 
Vektorforra ist. Die Erfindung soil jedoch diese anderen 
Expressionsvektorformen, wie virale Vektoren (z.B. replikations- 
defiziente Retroviren, Adenoviren und adenoverwandte Viren) , 

25 die Mhnliche Funktionen austiben, umfassen. Femer soil der 
Begriff Vektor auch andere Vektoren, die dem Fachmann bekcinnt 
sind, wie Phagen, Viren, wie SV40, CMS/, Baculovirus, Adenovirus, 
Transposons, IS-Elemente, Phasmide, Phageitiide, Cosmide, lineare 
Oder zirkul&re DNA, umfassen. 

30 

Die erf indungsgemaEen rekombinanten Expressionsvektoren umfassen 
eine erf indungsgemSfie Nukleinsfiure oder ein erfindungsgemaSes 
Genkonstrukt in einer Form, die sich zur Expression der Nuklein- 
sSure in einer Wirtszelle eignet, was bedeutet, dass die re- 

35 kombinanten Expressionsvektoren eine oder mehrere Regulations- 
sequenzen, ausgewahlt auf der Basis der zur Expression zu ver- 
wendenden Wirtszellen, die mit der zu exprimierenden Nuklein- 
sauresequenz funktionsf^ig verbunden ist, \mfasst. In einem 
rekombinanten Expressionsvektor bedeutet "funktionsfShig ver- 

40 bunden*' , dass die Nukleotidsequenz von Interesse derart an 
die Regulations sequenz (en) gebunden ist, dass die Expression 
der Nxikleotidsequenz m6glich ist und sie aneinander gebunden 
sind, so dass beide Sequenzen die vorhergesagte, der Sequenz 
zugeschriebene Funktion erfdllen (z.B.- in einem In-vitro- 

45 Transkriptions-ZTreoislationssystem oder in einer Wirtszelle, 
wenn der Vektor in die Wirtszelle eingebracht wird) . Der 
Begriff "Regulationssequenz" soil Promotoren, Enhancer und 
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andere Expressionskontrollelemente (z.B. Polyadenylierungs- 
signale) umfassen. Diese Regulationssequenzen sind z.B. 
beschrieben in Goeddel: Gene Expression Technology: Methods 
in Enzymology 185, Academic Press, San Diego, CA (1990), oder 
5 siehe: Gmber und Crosby, in: Methods in Plant Molecular Biology 
and Biotechnolgy, CRC Press, Boca Raton, Florida, Hrsgb.: Glick 
und Thompson, Kapitel 7, 89-108, einschlieElich der Literatur- 
stellen darin. Regulationssequenzen umfassen solche, welche die 
konstitutive Expression einer Nukleotidsequenz in vielen Wirts- 

10 zelltypen steuern, und solche, welche die direkte Expression der 
Nukleotidsequenz nur in bestimmten Wirtszellen xinter bestimmten 
Bedingungen steuern. Der Fachmauin weiS, dass die Gestaltung 
des Expressionsvektors von Faktoren, wie der Auswahl der zu 
trans formierenden Wirtszelle, dem AusmalS der Expression des 

15 gewiinschten Proteins usw., abhSngen kann. Die erf indungsgemafien 
E^ressionsvektoren konnen in Wirtszellen eingebracht werden, urn 
dadurch Proteine oder Peptide, einschlieSlich Fusionsproteinen 
Oder -peptiden, herzustellen, die von den Nukleinsauren, wie hier 
beschrieben, kodiert werden (z.B. Desaturasen, mutante Formen von 

20 Desaturasen, Fusionsproteine usw. ) . 

Die erfindungsgemafien rekombinanten Expressionsvektoren konnen 
2ur Expression von Desaturasen und Elongasen in prokaryotischen 
Oder eukaryotischen Zellen gestaltet sein. Beispielsweise konnen 

25 Desatvirasegene in bakteriellen Zellen, wie C. glutamicum, 

Insektenzellen (unter Verwendung von Baculovirus-Expressions- 
vektoren) , Hefe- und anderen Pilzzellen (siehe Romanes, M.A., 
et al. (1992) ''Foreign gene expression in yeast: a review", 
Yeast 8:423-488; van den Hondel, C. A. M.J. J., et al. (1991) 

30 "Heterologous gene expression in filamentous f\mgi", in: More 
Gene Manipulations in Fungi, J.W. Bennet & L.L. Lasure, Hrsgb., 
S. 396-428: Academic Press: San Diego; vmd van den Hondel, 
C. A.M. J. J., & Pxmt, P.J. (1991) "Gene transfer systems and vector 
development for filamentous fungi, in: Applied Molecular Genetics 

35 of Fungi, Peberdy, J.F., et al., Hrsgb., S. 1-28, Cambridge 
University Press: Cambridge), Algen (Falciatore et al., 1999, 
Marine Biotechnology. 1, 3:239-251), Ciliaten der Typen: Holo- 
trichia, Peritrichia, Spirotr ichia , Suctoria, Tetrahymena, Para- 
mecium, Colpidium, Glaucoma, Platyophrya, Potomacus, Desaturase- 

40 udocohnilembus, Euplotes, Engelmaniella und Stylonychia, ins- 

besondere der Gattung Stylonychia lemnae, mit Vektoren nach einem 
Trans formationsverfahr en, wie beschrieben in WO 98/01572, sowie 
Zellen vielzelliger Pflanzen (siehe Schmidt, R. und Willmitzer, 
L. (1988) "High efficiency Agrobacterivm tumefaci ens-mediated 

45 transformation of Arabidopsis thaliana leaf and cotyledon 

explants" Plant Cell Rep. : 583-586? Plant Molecular Biology and 
Biotechnology, C Press, Boca Raton, Florida, Kapitel 6/7, 
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S. 71-119 (1993); F.F. White, B. Jenes et al.. Techniques for 
Gene Transfer, in: Transgenic Plants, Bd. 1, Engineering and 
Utilization, Hrsgb.: Kung imd R. Wu, Academic Press (1993), 
128-43; Potrykus, Anna. Rev. Plant Physiol. Plant Molec. Biol. 42 
5 (1991), 205-225 (iind darin zitierte Literaturstellen) ) Oder 
SSugerzellen exprimiert werden. Geeignete Wirtszellen werden 
femer erortert in Goeddel, Gene Expression Technology: Methods 
in Enzymology 185, Academic Press, Scin Diego, CA (1990). Der 
rekombinante Expressionsvektor kann alternativ, zuiti Beispiel 
10 unter Verwendung von T7-Promotor-Regulationssequenzen und 

T7-Polyiaerase, in vitro transkribiert xind translatiert werden. 

Die Expression von Proteinen in Prokaryoten erfolgt meist mit 
Vektoren, die konstitutive oder induzierbare Promotoren ent- 

15 halten, welche die Expression von Fusions- oder nicht-Fusions- 
proteinen steuem. Fusionsvektoren fiigen eine Reihe von Amino- 
sauren an ein darin kodiertes Protein ein, gew5hnlich am Amino- 
terminus des rekombinanten Proteins, aber auch am C-Terminus 
Oder fusioniert innerhalb geeigneter Bereiche in den Proteinen. 

20 Diese Fusionsvektoren haben gewahnlich drei Aufgaben: 1) die 
Verstarkung der Expression von rekorobinantem Protein; 2) die 
Erh6himg der Loslichkeit des rekombinanten Proteins und 3) die 
UnterstUtzung der Reinigung des rekombinanten Proteins durch 
Wirkung als Ligand bei der Af f initatsreinigung . Bei Fusions- 

25 Expressionsvektor en wird oft eine proteolytische Spaltstelle an 
der Verbindungsstelle der Fusionseinheit und des rekombinanten 
Proteins eingebracht, so dass die Abtrennung des rekombinanten 
Proteins von der Fusionseinheit nach der Reinigung des Fusions- 
proteins m5glich ist. Diese Enzyme und ihre entsprechenden 

30 Erkennungssequenzen umfassen Faktor Xa, Thrombin und Entero- 
kinase . 

Typische Fusions-Expressionsvektoren sind u.a. pGEX (Pharmacia 
Biotech Inc; Smith, D.B., und Johnson, K.S. (1988) Gene 

35 67:31-40), pMAL (New England Biolabs, Beverly, MA) und pRIT5 
(Pharmacia, Piscataway, NJ) , bei denen Glutathion-S-Transf erase 
(GST) , Maltose E-bindendes Protein bzw. Protein A an das 
rekombinante Zielprotein fusioniert wird. Bei einer Ausftihrungs- 
form ist die Desaturase-kodierende Sequenz in einen pGEX- 

40 Expressionsvektor kloniert, so dass ein Vektor erzeugt wird, 

der ein Fusionsprotein kodiert, das vom N-Terminus zum C-Terminus 
GST-Thrombin-Spaltstelle-X-Protein umfasst. Das Fusionsprotein 
kann durch Af finitStschromatographie unter Verwendxing von Gluta- 
thion-Agarose-Harz gereinigt werden. Rekombinante Desatxirase, die 

45 nicht an GST fusioniert ist, keuin durch Spaltung des Fusions- 
proteins mit Thrombin- gewonnen werden. 
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Beispiele fiir geeignete induzierbare nicht-Fusions-E. coli- 
Expressionsvektoren sind u,a. pTrc (Amann et al. (1988) Gene 
69:301-315) und pET lid (Studier et al.. Gene Expression 
Technology: Methods in Enzymology 185, Academic Press, San Diego, 
5 Kalifornien (1990) 60-89) . Die Zielgenexpression vom pTrc-Vektor 
beruht auf der Transkription durch Wirts-RNA-Polymerase von einem 
Hybrid-trp-lac-Fusionspromotpr* Die Zielgenexpression aus dem pET 
lld-Vektor beruht auf der Transkription von einem T7-gnl0-lac- 
Fusions-Promotor, die von einer coexprimierten viralen RNA-Poly- 
10 merase (T7 gnl) vermittelt wird. Diese virale Polymerase wird 
von den Wirtsstammen BL21 (DE3) oder HMS174 (DE3) von einem 
residenten X-Prophagen bereitgestellt, der ein T7 gnl-Gen unter 
der Transkriptionskontrolle des lacUV 5-Promotors birgt, 

15 Andere in prokaryotischen Organismen geeignete Vektoren sind dem 
Fachmann bekcuint, diese Vektoren sind beispielsweise in E. coli 
pL6338, pACYC184, die pBR-Reihe, wie pBR322, die pUC-Reihe, wie 
pUC18 Oder pUC19, die M113mp-Reihe, pKC30, pRep4, pHSl, pHS2, 
pPLc236, PMBL24, pLG200, pUR290, pIN-IIlll^-Bl, ^gtll or pBdCI, 

20 in Streptomyces pIJlOl, pIJ364, pIJ702 oder pIJ361, in Bacillus 
pUBllO, pC194 Oder pBD214, in Corynebacterium pSA77 oder pAJ667. 
Eine Strategic zur Maximierung der Expression von rekombinantem 
Protein ist die Expression des Proteins in einem Wirtsbakterium, 
dessen Fahigkeit zur proteolytischen Spaltung des rekombinanten 

25 Proteins gestort ist (Gottesman, S., Gene Expression Technology: 
Methods in Enzymology 185, Academic Press, San Diego, Kalifornien 
(1990) 119-128). Eine weitere Strategic ist die Veranderung der 
Nukleinsauresequenz der in einen Expressionsvektor zu inserieren- 
den Nukleinsaure, so dass die einzelnen Codons fiir jede Amino- 

30 sSure diejenigen sind, die vorzugsweise in einem zur Expression 
ausgewahlten Bakterium, wie C. glutamicum, verwendet werden 
(Wada et al . (1992) Nucleic Acids Res. 20:2111-2118). Diese 
Veranderung der erf indungsgemaSen Nukleinsauresequenzen erfolgt 
durch Standard-DNA-Synthesetechniken. 

35 

Bei einer weiteren Aus fiihrungs form ist der Desaturase- 
Expressionsvektor ein Hefe-Expressionsvektor . Beispiele fiir 
Vektoren zur Expression in der Hefe S. cerevisiae umfassen 
pYeDesaturasecl (Baldari et al. (1987) Embo J. 6:229-234), 

40 pMFa (Kurjan und Herskowitz (1982) Cell 30:933-943), pJRY88 

(Schultz et al. (1987) Gene 54:113-123) sowie pYES2 (Invitrogen 
Corporation, San Diego, CA) . Vektoren imd Verfahren zur Kon- 
struktion von Vektoren, die sich zur Verwendung in anderen 
Pilzen, wie den filament6sen Pilzen, eignen, vimfassen diejenigen, 

45 die eingehend beschrieben sind in: van den Hondel, C.A.M.J. J. , & 
Punt, P.J. (1991) 'Gene transfer systems and vector development 
for filamentous fungi, in: Applied Molecular Genetics of fungi. 
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J.F. Peberdy et al., Hrsgb., S, 1-28, Cambridge University Press: 
Cambridge, oder in: More Gene Manipulations in Fungi [J.W. Bennet 
& L.L. Lasure, Hrsgb., S. 396-428: Academic Press: San Diego]. 
Weitere geeignete Hefevektoren sind beispielsweise pAG-1, YEp6, 
5 YEpl3 Oder pEMBLYe23 . 

Alternativ konnen die erf indungsgemafien Desaturasen in Insekten- 
zellen unter Verwendung von Baculovirus-Expressionsvektoren 
exprimiert werden. Baculovirus-Vektoren, die zur Expression von 
10 Proteinen in geztichteten Insektenzellen (z.B. Sf9-Zellen) ver- 
fUgbar sind, umfassen die pAc-Reihe (Smith et al. (1983) Mol. 
Cell Biol.. 3 :2156-2165) und die pVL-Reihe (Lucklow und Summers 
(1989) Virology 170:31-39). 

15 Die oben gensuinten Vektoren bieten nur einen kleinen Oberblick 
uber mSgliche geeignete Vektoren. Weitere Plasmide sind dem 
Fachmann bekannt und sind zum Beispiel beschrieben in: Cloning 
Vectors (Hrsgb. Pouwels, P.H., et al., Elsevier, Amsterdam- 
New York-Oxford, 1985, ISBN 0 444 904018). 

20 

Bei noch einer weiteren Ausftihuingsform wird eine erfindungs- 
gemafie Nukleinsaure in Saugerzellen \inter Verwendung eines 
Sauger-Expressionsvektors exprimiert. Unter S^ugem werden 
im Sinne der Erfindung alle nicht-humanen Sauger verstanden. 

25 Beispiele ftir SSuger-Expressionsvektoren umfassen pCDM8 (Seed, 
■ B. (1987) Nature 329:840) und pMT2PC (Kaufman et al. (1987) 
EMBO J. 6:187-195) . Bei der Verwendung in saugerzellen werden 
die Kontrollfunktionen des Express ionsvektors oft von viralen 
Regulationselementen bereitgestellt . Oblicherweise verwendete 

30 Promotoren stammen z.B. aus Polyoma, Adenovirus2, Cytomegalie- 
virus \ind Simian Virus 40. Weitere geeignete Expressionssysteme 
fur prokaryotische und eukaryotische Zellen siehe in den Kapiteln 
16 und 17 von Sambrook, J,, Fritsch, E.F., und Maniatis, T., 
Molecular Cloning: A Laboratory Manual, 2. Auflage, Cold Spring 

35 Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold 
Spring Harbor, NY, 1989. 

Bei einer euideren Ausftlhrungsfom kann der rekombinante SSuger- 
Expressionsvektor die Expression der Nukleinselure vorzugsweise in 

40 einem bestimmten Zelltyp steuern (z.B. werden gewebespezif ische 
Regulationselemente zur Expression der NukleinscLure verwendet) . 
Gewebespezif ische Regulationselemente sind im Fachgebiet bekannt . 
Nicht beschrankende Beispiele ftir geeignete gewebespezif ische 
Promotoren sind u.a. der Albiominpromotor (leberspezif iscl^; 

45 Pinkert et al, (1987) Genes Dev. 1:268-277), lymphoidspezif ische 
Promotoren (Calame und Eaton (1988) . Adv. Immimol. 43:235-275), 
insbesondere Promotoren von T-Zellrezeptoren (Winoto und 
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Baltimore (1989) EMBO J. 8:729-733) xmd Iiranunglobulinen (Banerji 
et al. (1983) Cell 33:729-740; Queen und Baltimore (1983) Cell 
33:741-748), netaronspezifische Promotoren (z»B. Neurofilament- 
Promotor; Byrne und Ruddle (1989) PNAS 86:5473-5477), pankreas- 
5 spezifische Promptoren (Edlund et al., (1985) Science 

230:912-916) und milchdriisenspezif ische Promotoren (z.B. Milch- 
serum-Promotor; US-Patent Nr. 4,873,316 und EuropSische Patent- 
anmeldung-Ver5f fentlichung Nr. 264,166). Auch entwicklungs- 
regulierte Promotoren sind umfasst, z.B. die hox- Promotoren 
10 der Maus (Kessel und Gruss (1990) Science 249:374-379) und 

der Fetoprotein-Promotor (Campes und Tilghman (1989) Genes Dev. 
3:537-546) . 

Bei einer weiteren AusftLhrungsf orm konnen die erf indungsgemaiSen 
15 Desaturasen in einzelligen Pflanzenzellen (wie Algen) , siehe 
Falciatore et al., 1999, Marine Biotechnology 1 (3):239-251 
und darin zitierte Literaturangaben, und Pflanzenzellen aus 
hoheren Pflanzen (z.B. Spermatophyten, wie Feldfr^ichten) 
exprimiert werden. Beispiele f\ir Pflanzen-Expressionsvektoren 
20 umfassen solche, die eingehend beschrieben sind in: Becker, D., 
Kemper, E., Schell, J., und Mast erson, R. (1992) * New plant 
binary vectors with selectable markers located proximal to the 
left border". Plant Mol. Biol. 20:1195-1197; und Bevan, M.W. 
(1984) "Binary Agrobacterium vectors for plant transformation", 
25 Nucl. Acids Res. 12:8711-8721; Vectors for Gene Transfer in 
Higher Plants; in: Transgenic Plants, Bd. 1, Engineering and 
Utilization, Hrsgb.: Kung und R. Wu, Academic Press, 1993, 
S. 15-38. 

30 Eine Pf loinzen-Expressionskassette enthS.lt vorzugsweise 

Regulationssequenzen, welche die Genexpression in Pflanzen- 
zellen steuern kSnnen und funktionsfahig verbunden sind, so dass 
jede Sequenz ihre Funktion, wie Termination der Transkription, 
erfiillen kann, beispielsweise Polyadenylierungssignale. Bevor- 

35 zugte Polyadenylierungssignale sind diejenigen, die aus Agro- 
bacteri\am tumef aciens-t-DNA stammen, wie das als Octopinsynthase 
bekannte Gen 3 des Ti-Plasmids pTiACHS (Gielen et al., EMBO 
J. 3 (1984) 835ff.) odfer funktionelle Jiquivalente davon, aber 
auch alle anderen in Pf leuizen fiinktionell aktiven Teinninatoreh 

40 sind geeignet. 

Da die Pflanzengenexpression sehr oft nicht auf Transkriptions- 
ebenen beschr&ikt ist, enthalt eine Pf lanzen-Bxpressionslicassette 
vorzugsweise andere funktionsfahig verbunden Sequenzen, wie 
45 Translationsenhancer, beispielsweise die Overdrive-Sequenz , 
welche die 5 ' -untremslatierte Leader-Sequenz aus Tabakmosaik- 
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virus, die das Protein/RNA-VerhSltnis erhoht, enthSlt (Gallie 
et al,, 1987, Nucl. Acids Research 15:8693-8711). 

Die Pf lanzengenexpression muss fuuktionsf^ig mit einem 
5 geeigneten Promoter verb\inden sein, der die Genexpression auf 
rechtzeitige, zell- oder gewebespezif ische Weise durchfiihrt. 
Bevorzugt sind Promotoren, welche die konstitutive Expression 
herbeifOhren (Benfey et al., EMBO J. 8 (1989) 2195-2202), wie 
diejenigen, die von Pf lanzenviren stammen, wie 35S CAMV (Franck 
10 et al., Cell 21 (1980) 285-294), 19S CaMV (siehe auch' US 5352605 
und WO 84/02913) oder Pf lanzenpromotoren, wie der in US 4,962,028 
beschriebene der kleinen Untereinheit der Rubisco. 

Andere bevorzugt e Sequenzen fllr die Verwendung zur funktions- 
15 fahigen Verbindung in Pf lanzengenexpressions-Kassetten sind 

Targe ting- Sequenzen, die zur Steuerung des Genproduktes in sein 
entsprechendes Zellkompartiment notwendig sind (siehe eine tJber- 
sicht in Kermode, Crit. Rev, Plant Sci- 15, 4 (1996) 285-423 
voad darin zitierte Literaturstellen) , beispielsweise in die 
20 Vakuole, den Zellkern, alle Art en von Plastiden, wie Amylo- 

plasten, Chloroplasten, Chromoplasten, den extrazellulcLren Raum, 
die Mitochondrien, das Gndoplasmat ische Retikuliun, Olk5rper, 
Peroxisomen und andere Kompartimente von Pflanzenzellen. 

25 Die Pf lanzengenexpression lasst sich auch iiber einen chemisch 
induzierbaren Promoter erleichtern (siehe eine Ubersicht in Gatz 
1997, Annu, Rev. Plant Physiol. Plant Mol. Biol., 48:89-108). 
Chemisch induzierbare Promotoren eignen sich besonders, wenn 
gewtinscht wird, dass die Genexpression auf zeitspezif ische Weise 

30 erfolgt. Beispiele ftir solche Promotoren sind ein SalicylsMure- 
induzierbarer Promoter (WO 95/19443), ein Tetracyclin-induzier- 
barer Promoter (Gatz et al. (1992) Plant J. 2, 397-404) und ein 
Etheuiol-induzierbarer Promoter. 

35 Auch Promotoren, die auf biotische oder abiotische Stress- 

bedingungen reagieren, sind geeignete Promotoren, beispielsweise 
der pathogeninduzierte PRPl-Gen-Promotor (Ward et al., Plant. 
Mol. Biol. 22 (1993) 361-366), der hitzeinduzierbare hsp80- 
Promoter aus Tomate (US 5,187,267), der kalteinduzierbare Alpha- 

40 amylase-Promotor aus Kartoffel (WO 96/12814) oder der durch 
Wunden induzierbare pinll-Promotor (EP-A-0 375 091) . 

Es sind insbesondere solche Promotoren bevorzugt, welche die 
Genexpression in Geweben und Organen herbeiftlhreni In denen 
45 die Lipid- und dlbiosynthese stattfindet, in Samenzellen, wie 
den Zellen des Endosperms und des sich entwickelnden Embryos. 
Geeignete Promotoren sind der Napingen-Prometor aus Raps 
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(US 5,608,152), der USP-Promotor aus Vicia faba (Baeumlein 
et al,, Mol Gen Genet, 1991, 225 (3):459-67), der Oleosin- 
Promotor aus Arabidopsis (WO 98/45461) , der Phaseolin-Promotor 
aus Phaseolus vulgaris (US 5,504,200), der Bce4-Proinotor aus 
5 Brassica (WO 91/13980) oder der Leg\imin~B4-Promotor (LeB4; 
Baeumlein et al., 1992, Plant Journal, 2 (2) :233-9) sowie 
Promotoren, welche die samenspezifische Expression in Mono- 
kotyledonen-Pf lanzen, wie Mais, Gerste, Weizen, Roggen, Reis usw. 
herbeiftihren. Geeignete beachtenswerte Promotoren sind der lpt2- 

10 Oder Iptl-Gen-Promotor aus Gerste (WO 95/15389 und WO 95/23230) 
Oder die in WO 99/16890 beschriebenen (Promotoren aus dem 
Gersten-Hordein-Gen, dem Reis-Glutelin-Gen, dem Reis-Oryzin-Gen, 
dem Reis-Prolamin-Gen, dem Weizen-Gliadin-Gen, Weizen-Glutelin- 
Gen, dem Mais-Zein-Gen, dem Haf er-Glutelin-Gen, dem Sorghum- 

15 Kasirin-Gen, dem Roggen-Secalin-Gen) . 

Insbesondere kann die multiparallele Expression von erfindungs- 
gemaSen Desaturasen allein oder in Kombination mit anderen 
desaturasen oder Elongasen gewiinscht sein. Die Einf^ihrung solcher 

20 Expressionskassetten kann aber eine simultane Transformation 
mehrerer einzelner Expressionskonstrukte erfolgen oder durch 
Kombination mehrerer Expressionskassetten auf einem Konstrukt, 
Auch konnen mehrere Vektoren mit mit jeweils mehreren 
Exopressionskassetten transformiert und auf die Wirtszelle 

25 Qbertragen werden. 

Ebenfalls besonders geeignet sind Promotoren, welche die 
plastidenspezifische Expression herbeifOhren, da Plastiden 
das Kompartiment sind, in dem die Vorlaufer sowie einige End- 
30 produkte der Lipidbiosynthese synthetisiert werden. Geeignete 
Promotoren, wie der virale RNA-Polymerase-Promotor , sind 
beschrieben in WO 95/16783 und WO 97/06250, Tind der clpP- 
Promotor aus Arabidopsis, beschrieben in WO 99/46394. 

35 Die Erfindung stellt zudem einen rekombinanten Expressions- 
vektor bereit, umfassend ein erfindungsgemaSes DNA Molekiil, 
das in Antisense-Richtung in den Expressionsvektor kloniert 
ist. d.h. das DNA-Molektil ist derart mit einer regulatorischen 
Sequenz funktionsf Shig verbxinden, dass die Expression (durch 

40 Transkription des DNA-Molekiils) eines RNA-Molektils , das zur 
Desaturase-mRNA "Antisense* ist, ermSglicht wird. Es kSnnen 
Regulationssequenzen ausgewSLhlt werden, die funktionsfShig mit 
einer in Antisense-Richtung klonierten NukleinsMure verbiinden 
sind ynd die kontinuierliche Expression des Antisense-RNA-Mole- 

45 kQls in einer Vielzahl von Zelltypen steuem, zum Beispiel kttnnen 
virale Promotoren \md/oder Enhancer oder Regulationssequenzen 
ausgewShlt werden, welche die konstitutive, gewebespezif ische 
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Oder zelltypspezif ische Expression von Antisense-RNA steuern. 
Der Antisense-E3cpressionsvektor kann in Form eines rekombinanten 
Plasmids, Phagemids oder attenuierten Virus vorliegen, in dam 
Antisense-Nukleinsauren unter der Kontrolle eines hochwirksaitien 
5 regulator ischen Bereichs produziert werden, dessen Aktivitat 
durch den Zelltyp bestiirant werden kann, in den der Vektor 
eingebracht worden ist. Eine ErlSuterung der Regulation der 
Genexpression mittels Ant i sense-Gen en siehe in Weintraub, H., 
et al., Antisense-RNA as a molecular tool for genetic analysis, 
10 Reviews - Trends in Genetics, Bd. 1(1) 1986. 

Bin weiterer Aspekt der Erfindung betrifft Wirtszellen, in die 
ein erf indungsgemcLfier rekombinanter Expressionsvektor eingebracht 
worden ist. Die Begriffe "Wirtszelle" und "rekombinante Wirts- 

15 zelle*" werden hier untereinander austauschbar verwendet. Selbst- 
verstandlich betref fen diese Begriffe nicht nur die bestimmte 
Zielzelle, sondem auch die Nachkoinmen oder potentiellen Nach- 
kommen dieser Zelle. Da in aufeinanderfolgenden Generationen auf- 
grund von Mutation oder Umwelteinf Ittssen bestimmte Modif ikationen 

20 auftreten konnen, sind diese Nachkommen nicht unbedingt mit der 
Parentalzelle identisch, sind jedoch immer noch vom Umfang des 
Begriffs, wie hier verwendet, umfasst, 

Unter Rekombinant oder Transgen beispielsweise rekombinanten 
25 Expressionsvektor oder rekombinanten Wirt oder Wirtszellen im 
Sinne der Erfindung ist zu verstehen, dass die erf indungsgemSfien 
NukleinsSLuren und/oder deren naturliche Regulationssequenzen an 
5' und 3 '-Position der NukleinsSuren nicht in ihrer natttrlichen 
Umgebung sind, das heiSt entweder wurde die Lage der Sequenzen im 
30 Herkunf storganismus verandert oder in diesem wurden die Nuklein- 
sauresequenzen und/oder die Regulationssequenzen mutiert oder die 
erfindungsgemSEen NukleinsSuresequenzen wurden in einen cuideren 
Organismus als den Herkunfstorganismus verbracht oder deren 
Regulationssequenzen. Auch Kombinationen dieser Veranderungen 
35 sind moglich. Unter nattirlicher Umgebung ist die Lage einer 
NukleinscLuresequenz in einem Organismus zu verstehen, wie er 
in der Natur vorkommt, 

Eine Wirtszelle kann eine prokaryotische oder eukaryotische 
40 Zelle sein, Z\m Beispiel kann eine Desaturase in Bakterienzellen, 
wie C. glutamicum, Insektenzellen, Pilzzellen oder SSLugerzellen 
(wie Chinesischer Hamster-Ovarzellen (CHO) oder COS-Zellen) , 
Algen, Ciliaten, Pf lanzenzellen, Pilzen oder anderen Mikro- 
organismen, wie C, glutamicum, exprimiert werden. Andere 
45 geeignete Wirtszellen sind dem Fachmann gelSufig. 
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Vektor-DNA lasst sich in prokaryotische oder eukaryotische Zellen 
liber herkSmmliche Transformations- oder Trans fektionstechniken 
einbringen. Die Begriffe ''Transformation" und "Trans fektion", 
Konjugation und Transduktion, wie hier verwendet, sollen eine 
5 Vielzahl von im Stand der Technik bekannten Verfahren 2um 
Einbringen fremder Nukleinsaure (z.B. DNA) in eine Wirtszelle, 
einschliefilich CalciiJinphosphat- oder Calcioomchlorid-Coprazi- 
pitation, DEAE-Dextran-vermittelte Transf ektion, Lipofektion, 
natiirliche Kompetenz, chemisch vermittelter Transfer, Elektro- 

10 poration oder Teilchenbeschuss, umfassen, Geeignete Verfaliren 
zur Transformation oder Transfektion von Wirtszellen, einschlieS- 
lich Pflanzenzellen, lassen sich finden in Sambrook et al. 
(Molecular Cloning: A Laboratory Manual., 2, Aufl., Cold Spring 
Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold 

15 Spring Harbor, NY, 1989) und anderen Labor-Handbiichern, wie 
Methods in Molecular Biology, 1995, Bd. 44, Agrobacterium 
protocols, Hrsgb: Gartland und Davey, Humana Press, Totowa, 
New Jersey. 

20 t5ber die stabile Transfektion von Saugerzellen ist bekannt, 
dass je nach verwendetem Express ions vekt or und verwendeter 
Trans fektionstechnik nur ein kleiner Teil der Zellen die fremde 
DNA in ihr Genora integriert. Zur Identif ikation und Selektion 
dieser Integranten wird gewOhnlich ein Gen, das einen selektier- 

25 baren Marker (z.B. Resistenz gegen Antibiotika) kodiert, zusammen 
mit dem Gen von Interesse in die Wirtszellen eingebracht, Bevor- 
zugte selektierbare Marker umfassen solche, welche Resistenz 
gegen Medikamente, wie G418, Hygromycin und Methotrexat, ver- 
leihen, oder in Pflanzen solche, welche Resistenz gegen ein 

30 Herbizid, wie Glyphosphat oder Glufosinat, verleihen. Weitere ge- 
eignete Marker sind beispielsweise Marker, welche Gene kodieren, 
die an Biosynthesewegen von zum Beispiel Zuckem oder Aminoscluren 
beteiligt sind, wie fi-Galactodsidase, ura3 oder ilv2. Marker, 
welche Gene, wie Luzif erase, gfp oder andere Fluoreszenzgene 

35 kodieren, sind ebenfalls geeignet. Diese Marker lassen sich in 
Mutanten verwenden, in denen diese Gene nicht funktionell sind, 
da sie beispielsweise mittels herkSmralicher Verfahren deletiert 
worden sind. Femer k6nnen Marker, welche eine NukleinsSure 
kodieren, die einen selektierbaren Marker kodiert, in eine Wirts- 

40 zelle auf dem gleichen Vektor eingebracht werden, wie derjenige, 
der eine Desaturase kodiert, oder konnen auf einem gesonderten 
Vektor eingebracht werden. Zellen, die mit der eingebrachten 
Nukleinsaure stabil transf iziert worden sind, kSnnen zuiu Beispiel 
durch Medikamentenselektion identif iziert werden (z.B. viberleben 

45 Zellen, die den selektierbaren Marker integriert haben, wohin- 
gegen die anderen Zellen eUssterben) . 
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Zur Erzeugung eines homolog rekombinierten Mikroorganismus wird 
ein Vektor hergestellt, der zijonindest einen Abschnitt eines 
Desaturasegens enthSlt, in den eine Deletion, Addition oder 
Substitution eingebracht worden ist, urn dadurch das Desaturasegen 
5 zu verMndem, z.B. funktionell zu disriunpieren. Dieses Desatura- 
segen ist vorzugsweise ein Phaeodactylum tricomutum Desaturase- 
gen, es keum jedoch ein Homologon oder Analogon aus anderen 
Organismen, sogar aus einer Sauger-, Pilz- oder Insektenquelle 
verwendet werden. Bei einer bevorzugten Ausfiihrungsf orm ist der 

10 Vektor so gestaltet, dass das endogene Desaturasegen bei homo- 
loger Rekombination funktionell disrumptiert wird (d.h. nicht 
langer ein funktionelles Protein kodiert, auch als Knock-out- 
Vektor bezeichnet) . Alternativ kann der Vektor so gestaltet 
sein, dass das endogene Desaturasegen bei homologer Rekombination 

15 mutiert oder anderweitig verSndert wird, aber iinmer noch ein 
funktionelles Protein kodiert (z.B. kann der stromaufwarts 
gelegene regulatorische Bereich so verSndert sein, dass da- 
durch die Expression der endogenen Desaturase verandert wird) . 
Zur Erzeugxing einer Punktmutation iiber homologe Rekombination 

20 k5nnen auch als Chimeraplasty bekannte DNA-RNA-Hybride ver- 
wendet werden, die aus Cole-Strauss et al., 1999, Nucleic 
Acids Research 27 (5) :1323-1330 und Kmiec, Gene therapy, 19999, 
American Scientist, 87 (3) :240-247 bekannt sind. 

25 Im Vektor fiir die homologe Rekombination ist der verSnderte 
Abschnitt des Desaturasegens an seinem 5'- und 3'-Ende von 
zusatzlicher NukleinsSure des Desaturasegens flankiert, so dass 
homologe Rekombination zwischen dem exogenen Desaturasegen, das 
auf dem Vektor vorliegt, und einem endogenen Desaturasegen in 

30 einem Mikroorganismus oder einer Pflanze moglich ist. Die zusStz- 
liche flankierende Desaturase-Nukleins^ure ist fiir eine erfolg- 
reiche homologe Rekombination mit dem endogenen Gen hinreichend 
lang. Gew5hnlich sind im Vektor mehrere hundert Basenpaare bis 
zu Kilobasen flankierende DNA (sowohl am 5'- als auch am 3'-Ende) 

35 enthalten (eine Beschreibung von Vektoren zur homologen Rekombi- 
nation siehe z.B. in Thomas, K.R., und Capecchi, M.R. (1987) 
Cell 51:503 oder der Rekombination in Physcomitrella patens 
auf cDNA-Basis in Strepp et al., 1998, Proc. Natl. Acad. Sci. 
USA 95 (8) :4368-4373) . Der Vektor wird in einen Mikroorganismus 

40 Oder eine Pflanzenzelle (z.B. mittels Polyethylenglycol-ver- 
mittelter DNA) eingebracht, \md Zellen, in denen das einge- 
brachte Desaturasegen ndt dem endogenen Desaturasegen homolog 
rekombiniert ist, werden unter Verwendung im Fachgebiet bekannt er 
Techniken selektiert. 
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Bei einer anderen Ausfuhrungsfom konnen rekombiiicinte Organismen, 
wie Mikroorganismen, hergestellt werden, die ausgewShlte Systeme 
enthalten, welche eine regulierte Expression des eingebrachten 
Gens ermaglichen. Der Einschlufi eines Desaturasegens in einem 
5 Vektor, wobei es unter die Kontrolle des lac-Operons gebracht 
wird, enaoglicht z.B. die Expression des Desaturasegens nur in 
Gegenwart von IPTG. Diese Regulationssysteme sind im Fachgebiet 
bekannt . 

10 Eine erf indungsgemS&e Wirtszelle, wie eine prokaryotische oder 
eukaryotische Wirtszelle, in Kultur oder auf einem Feld wachsend, 
kann zur Produktion (d.h. Expression) einer Desaturase verwendet 
werden. In Pflanzen kann zus^tzlich ein alternatives Verfahren 
durch direkten Transfer von DNA in sich entwickelnde Bliiten liber 

15 Elektroporation oder Gentransfer mittels Agrobacteriiaiti ange- 
wendet werden. Die Erfindxing stellt folglich ferner Verfahren 
zur Produktion von Desaturasen unter Venvendung der erfindungs- 
gemaSen Wirtszellen bereit, Bei einer Ausfuhr\ingsform umfasst das 
Verfahren die Anzucht der erf indungsgemafien Wirtszelle (in die 

20 ein rekombinanter Expressionsvektor, der eine Desaturase kodiert, 
eingebracht worden ist, oder in deren Genom ein Gen eingebracht 
worden ist, das eine Wildtyp- oder veranderte Desaturase kodiert) 
in einem geeigneten Medium, bis die Desaturase produziert worden 
ist. Das Verfahren umfasst bei einer weiteren Ausfuhrungsf orm das 

25 Isolieren der Desaturasen aus dem Mediiim oder der Wirtszelle. 

Wirtszellen, die im Prinzip zum Aufnehmen der erfindungs- 
gemSfien Nukleinsaure, des erf ind\mgsgema£en Genproduktes 
Oder des erf indungsgemalSen Vektors geeignet sind, sind alle 

30 prokaryotischen oder eukaryotischen Organismen. Die vorteil- 
hafterweise verwendeten Wirtsorganismen sind Organismen, wie 
Bakterien, Pilze, Hefen, Tier- oder Pf lanzenzellen. Weitere vor- 
teilhafte Organismen sind Tiere oder vorzugsweise Pflanzen oder 
Teile davon. Pilze^ Hefen oder Pflanzen werden vorzugsweise ver- 

35 wendet, besonders bevorzugt Pilze oder Pflanzen, gauiz besonders 
bevorzugt 'Pflanzen, wie Olfruchtpf lanzen, die groiSe Mengen an 
Lipidverbindxangen enthalten, wie Raps, Nachtkerze, Canola, 
Erdnuss, Lein, Soja, Safflor, Sonnenblume, Borretsch, oder 
Pflanzen, wie Mais, Weizen, Roggen, Hafer, Triticale, Reis, 

40 Gerste, Baumwolle, Maniok, Pfeffer, Tagetes, Solanaceen-Pf lanzen, 
wie Kartoffel, Tabak, Aubergine und Tomate, Vicia-lVrten, Erbse, 
Alfalfa, Buschpflanzen (Kaffee, KcJcao, Tee), Salix-Arten, BSume 
(Olplame, KokosnulS) sowie ausdauernde Gr^ser und Futterfeld- 
frtichte. Besonders bevorzugte erf indungsgemSSe Pflanzen sind 

45 Olfruchtpf lanzen, wie Soja, Erdnuss, Raps, Canola, Lein, Nacht- 
kerze, Sonnenblume, Saf flor, BSume (dlpalme, Kokosnufi) . 
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D. Isollerte besaturase 

Ein weiterer Aspekt der Erfindung betrifft isolierte Desaturasen 
und biologisch aktive Teile davon. Ein "isoliertes" oder "ge- 

" 5 reinigtes" Protein oder ein biologisch aktiver Teil davon ist 
im wesentlichen frei von zelluiarem Material, wenn es durch DNA- 
Rekombinationstechniken produziert wird, oder von cheraischen Vor- 
stufen Oder andern Chemikalien, wenn es chemisch synthetisiert 
wird. Der Begriff "im wesentlichen frei von zellularem Material" 

10 umf asst Desaturase-PrSparationen, in denen das Protein von zellu- 
lelren Komponenten der Zellen, in denen es natiirlich oder rekombi- 
nant produziert wird, getrennt ist. Bei einer Ausftihrungsform \iin- 
fasst der Ausdruck "im wesentlichen frei von zellularem Material" 
Desaturase-Pr^parationen mit weniger als etwa 30 % (bezogen auf 

15 das Trockengewicht) nicht-Desaturase (hier auch als "verunreini- 
gendes Protein" bezeichnet) , starker bevorzugt weniger als etwa 
20 % nicht-Desaturase, noch starker bevorzugt weniger als etwa 
10 % nicht-Desaturase und am stfirksten bevorzugt weniger als etwa 
5 % nicht-Desaturase. Wenn die Desaturase oder ein biologisch 

20 aktiver Teil davon rekombinant hergestellt worden ist, ist sie/er 
auch im wesentlichen frei von Kulturmedium, d.h. das Kulturmedium 
macht weniger als etwa 20 %, starker bevorzugt weniger als etwa 
10 % und am stSrksten bevorzugt weniger als etwa 5 % des Volximens 
der Proteinpraparation aus. Der Begriff "im wesentlichen frei von 

25 chemischen Vorstufen oder anderen Chemikalien" umfasst Desatura- 
se-Praparationen, in denen das Protein von chemischen Vorstufen 
Oder anderen Chemikalien getrennt ist, die an der Synthese des 
Proteins beteiligt sind. Bei einer Aus fuhrungs form lamfasst der 
Begriff "im wesentlichen frei von chemischen Vorstufen oder 

30 anderen Chemikalien" Desaturase-Praparationen mit weniger als 
etwa 30 % (bezogen auf das Trockengewicht) chemischen Vorstufen 
Oder nicht-Desaturase-Chemikalien, starker bevorzugt weniger als 
etwa 20 % chemischen Vorstufen oder nicht-Desaturase-Chemikalien, 
noch starker bevorzugt weniger als etwa 10 % chemischen Vorstufen 

35 Oder nicht-Desaturase-Chemikalien und am starksten bevorzugt 

weniger als etwa 5 % chemischen Vorstufen oder nicht-Desat\irase- 
Chemikalien. Bei bevorzugten Ausftihrungsf ormen weisen isolierte 
Proteine oder biologisch aktive Teile davon keine ver\mreinigen- 
den Proteine aus dem gleichen Organismus auf, aus dem die 

40 Desaturase stammt. Diese Proteine werden gewohnlich durch 

rekombinante Expression ziuii Beispiel Phaeodactylum tricomutum- 
Desaturase in Pflanzen wie Physcomitrella patens bzw, o,g. 
oder Mikroorgcinismen, beispielsweise Bakterien, wie E. coli. 
Bacillus sxibtilis, C. glutamic\«a, Pilzen, wie Mortierella, Hefe, 

45 wie Saccharomyces , oder Ciliaten wie Colpidium oder Algen wie 
Phaeodactyliam hergestellt • 
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Eine erf indungsgemafie isolierte Desaturase oder ein Teil davon 
kann auch am Stof fwechsel von zum Aufbau von Zellmembranen in 
Phaeodactylum tricornutum notwendigen Verbindungen oder am 
Trcinsport von Molekillen tiber diese Meitibranen teilnehmen. Bei 
5 bevorzugten Ausfiihrungsformen umfasst das Protein oder der Teil 
davon eine Aminos^uxesequenz , die ausreichend homolog zu einer 
AndnosSuresequenz der SEQ ID NO: 2, 4, 6 oder 12 ist, dass das 
Protein oder der Teil davon die Fahigkeit, am Stof fwechsel von 
zum Aufbau von Zellmembranen in Phaeodactylum tricornutum not- 

10 wendigen Verbindungen oder am Transport von Molekillen iiber diese 
Membranen teilzunehmen, beibehalt. Der Teil des Proteins ist vor- 
zugsweise ein biologisch aktiver Teil, wie hier beschrieben. Bei 
einer weiteren bevorzugten Ausfiihrungsf orm hat eine erfindungs- 
gemafie Desaturase eine der in SEQ ID NO: 2, 4, 6 oder 12 

15 gezeigten AminosSuresequenzen. Bei einer weiteren bevorzugten 
Ausfiihrungsf orm hat die Desatureise eine Aminos SuresecpienZ/ 
die von einer Nukleotidsequenz kodiert wird, die, zum Beispiel 
unter stringenten Bedingxingen, an eine Nukleotidsequenz der 
SEQ ID NO: 1, 3, 5 oder 11 hybridisiert . Bei noch einer weiteren 

20 bevorzugten Ausfiihrungsf orm hat die Desaturase eine AminosSure- 
sequenz, die von einer Nukleotidsequenz kodiert wird, die min- 
destens etwa 50 bis 60 vorzugsweise mindestens etwa 60 bis 
70 %/ starker bevorzugt mindestens etwa 70 bis 80 %, 80 bis 90 %, 
90 bis 95 % und noch starker bevorzugt mindestens etwa 96 %, 

25 97 %, 98 %, 99 % oder noch homologer zu einer der AminosSure- 
sequenzen der SEQ ID NO: 2, A, 6 oder 18 ist. Die erfindungs- 
gemafie bevorzugte Desaturase besitzt vorzugsweise auch mindestens 
eine der hier beschriebenen Desaturase-Aktivitaten. Zvim Beispiel 
vimfasst eine erf indungsgemSSe bevorzugte Desaturase eine Amino- 

30 sSuresequenz , die von einer Nukleotidsequenz kodiert wird, die, 
zum Beispiel vmter stringenten Bedingungen, an eine Nukleotid- 
sequenz der SEQ ID NO: 1, 3, 5 oder 11 hybridisiert und am Stoff- 
wechsel von zum Aufbau von Zellmembranen in Phaeodactylum tri- 
cornutum notwendigen Verbindungen oder am Transport von Molekiilen 

35 iiber diese Membranen teilnehmen kann oder eine Doppelbindung in 
eine Fettsaure mit ein, zwei, drei oder vier Doppelbindungen und 
einer K^ttenlange von Cis, C20 oder C22 einfiihrt. 

Bei anderen Ausfiihrungsformen ist die Desaturase im wesentlichen 
40 homolog zu einer AminosSuresequenz der SEQ ID NO: 2, 4 oder 6 
und behait die funktionelle Aktivitat des Proteins einer der 
Sequenzen der SEQ ID NO: 2, 4 oder 6 bei, ihre. Aminosfiuresequenz 
unterscheidet sich jedoch aufgrund von natiirlicher Variation oder 
Mutagenese, wie eingehend im obigen Unterabschnitt I beschrieben. 
45 Bei einer weiteren Ausfiihrungsf orm ist die Desaturase folglich 
ein Protein, das eine* Aminos&ureseqcuenz \unfasst, die mindestens 
etwa 50 bis 60 %, vorzugsweise mindestens etwa 60 bis 70 % und 
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stSrker bevorzugt mindestens etwa 70 bis 80 %, 80 bis 90 90' 
bis 95 % \and am stcLrksten bevorzugt mindestens etwa 96 %, 97 %, 
98 %, 99 % Oder noch homologer zu einer vollstSndigen Aminosaxire- 
sequenz der SEQ ID NO: 2, 4 oder 6 ist und zumindest eine der 
5 hier beschriebenen Desaturase-AktivitSten aufweist. Bei einer 
anderen AusfUhrungsf orm betrifft die Erfindung ein vollstandiges 
Phaeodactylum tricornutiom- Protein, das im wesentlichen homolog zu 
einer vollstclndigen AminosSuresequenz der SEQ ID NO: 2, 4 oder 6 
ist. 

10 

Biologisch aktive Teile einer Desaturase \jmfassen Peptide, 
umfassend AtninosSuresequenzen, die von der AminosSureseguenz 
einer Desaturase hergeleitet sind, z.B. eine in SEQ ID NO: 2, 
4 Oder 6 gezeigte Aminosauresequenz oder die Amino sauresequenz 

15 eines Proteins, das zu einer Desaturase homolog ist, welche 
weniger Aminosauren als die Vollangen-Desaturase oder das 
VollSngenprotein aufweisen, das zu einer Desaturase homolog 
ist, und zumindest eine Aktivitat einer Desaturase aufweisen. 
Gew5hnlich umfassen biologisch aktive Teile (Peptide, z.B. 

20 Peptide, die zum Beispiel 5, 10, 15, 20, 30, 35, 36, 37, 38, 
39, 40, 50, 100 Oder mehr AminosSuren lang sind) eine Dom&ae 
Oder ein Motiv mit mindestens einer Aktivitat einer Desaturase, 
Uberdies konnen andere biologisch aktive Teile, in denen 
andere Bereiche des Proteins deletiert sind, durch rekombinante 

25 Techniken hergestellt und bezuglich einer oder mehrerer der 

hier beschriebenen Aktivitaten untersucht werden. Die biologisch 
aktiven Teile einer Desaturase umfassen vorzugsweise ein/eine 
Oder mehrere ausgewahlte DomSnen/Motive oder Teile davon mit 
biologischer Aktivitat. 

30 

Desaturasen werden vorzugsweise durch DNA-Rekombinat ions techniken 
hergestellt. Zum Beispiel wird ein das Protein kodierendes 
Nukleinsauremolekiil in einen Expressionsvektor (wie vorstehend 
beschrieben) kloniert, der Expressionsvektor wird in eine 

35 Wirtszelle (wie vorstehend beschrieben) eingebracht, und die 
Desaturase wird in der Wirtszelle exprimiert. Die Desaturase 
kann dann durch ein geeignetes Reinigungsschema mittels Standard- 
Proteinreinigimgstechniken aus den Zellen isoliert werden. Alter- 
nativ 2ur rekombinanten Expression kann eine Desaturase, ein 

40 -Polypeptid, oder -Peptid mittels Standard-Peptidsynthese- 
techniken chemisch synthetisiert werden. "Oberdies kfiuin native 
Desaturase aus Zellen (z.B. Endothelzellen) z.B. unter Verwendung 
eines Anti-Desaturase-AntikOrpers isoliert werden, der durch 
Standardtechniken produziert werden kann, wobei eine erfindungs- 

45 gema&e Desaturase oder ein Fragment davon verwendet wird. 
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Die Erfindung stellt auch chimare Desaturase-Proteine oder 
Desaturase-Fusionsproteine bereit. Wie hier verwendetf tomfasst 
ein "chimares Desaturase-Protein" oder "Desaturase-Fusions- 
protein" ein Desaturase-Polypeptid, das funktionsfShig an ein 
5 nicht-Desaturase-Polypeptid gebimden ist. Ein ''Desaturase-Poly- 
peptid" betrifft ein Polypeptid mit einer Aminosauresequenz, die 
einer Desaturase entspricht, wohingegen ein "nicht-Desaturase- 
Polypeptid" ein Polypeptid itiit einer AminosSuresequenz betrifft, 
die einem Protein entspricht, das im wesentlichen nicht homolog 

10 zu der Desaturase ist, z.B. ein Protein, das sich vom der 
Desaturase unterscheidet und aus dem gleichen oder einem 
anderen Organismus stammt, Innerhalb des Fusionsproteins 
soil der Begriff "funktionsf SLhig verbunden* bedeuten, dass 
das Desaturase-Polypeptid und das nicht-Desaturase-Polypeptid 

15 so miteinander fusioniert sind, dass beide Sequenzen die vor- 
hergesagte, der verwendeten Sequenz zugeschriebene Funktion 
erf alien. Das nicht-Desaturase-Polypeptid kann an den N-Tenninus 
Oder den C-Terminus des Desaturase-Polypeptids fusioniert sein. 
Bei einer Aus fuhrtings form ist das Fusionsprotein zum Beispiel 

20 ein GST-Desaturase-Fusionsprotein, bei dem die Desatiirase- 

Sequenzen an den C-Terminus der GST-Sequenzen fusioniert sind. 
Diese Fusionsproteine konnen die Reinigung der rekombinanten 
Desaturasen erleichtern. Bei einer weiteren Ausfahr\ingsf orm ist 
das Fusionsprotein eine Desaturase, die eine heterologe Signal- 

25 sequenz an ihrem N-Terminus aufweist. In bestimmten Wirtszellen 
(z.B. SSuger-Wirtszellen) kann die Expression und/oder Sekretion 
einer Desaturase durch Verwendung einer heterologen Signalsequenz 
gesteigert werden. 

30 Ein erf indungsgemafies chimSres Desaturase-Protein oder 

Desaturase-Fusionsprotein wird durch Standard-DNA-Rekombinations- 
techniken hergestellt. Zum Beispiel werden DNA-Fragmente , die 
unterschiedliche Polypeptidsequenzen kodieren, gemalS herkomm- 
licher Techniken im Leseraster aneinander ligiert, indem 

35 beispielsweise glatte oder liberhangende Enden zur Ligation, 
Restriktionsenzymspaltiing zur Bereitstell\ing geeigneter Enden, 
Aufftillen kohSsiver Enden, wie erforderlich, Behandliing mit 
alkalischer Phosphatase, urn ungewollte VerknUpfxingen zu ver- 
meiden, und enzymatische Ligation eingesetzt werden. Bei einer 

40 weiteren Aus ftflirungs form kann das Fusionsgen durch herkommliche 
Techniken, einschliefilich DNA-Syntheseautomaten, synthetisiert 
werden. Alternativ kann eine PCR-Amplif izierung von Genfragnienten 
unter Verwendung von Ankerprimem durchgefOhrt werden, die 
komplementare Oberhfinge zwischen aufeinanderfolgenden Gen- 

45 fragmenten erzeugen, die anschliefiend miteinander hybridisiert 
und reamplif iziert werden k6nnen, so dass eine chimSre Gensequenz 
erzeugt wird (siehe zum Beispiel Current Protocols in Moleculeur 
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Biology, Hrsgb. Ausubel et al., John Wiley & Sons: 1992), Uber- 
dies sind viele Expressionsvektoren koinmerziell erhSltlich, die 
bereits eine Fusionseinheit (z.B. ein GST-Polypeptid) kodieren. 
Eine Desaturase-kodierende NukleinsSure kann in einen solchen 
5 Expressionsvektor kloniert werden, so dass die Fusionseinheit 
im Leseraster mit dem Desaturase-Protein verbunden ist. 

Homologe der Desaturase konnen durch Mutagenese, z.B. durch 
spezifische Punktmutation oder VerkClrzung der Desaturase, erzeugt 

10 werden. Der Begriff "Homologe", wie hier verwendet, betrifft eine 
variante Fom der Desaturase, die als Agonist oder Antagonist 
der Desaturase-Aktivitat wirkt. Ein Agonist der Desaturase kann 
im wesentlichen die gleiche Aktivitat wie die oder einen Teil 
der biologischen AktivitcLten der Desaturase beibehalten. Ein 

15 Antagonist der Desaturase kann eine oder mehrere Aktivitaten der 
natiirlich vorkommenden Form der Desaturase durch zum Beispiel 
kompetitive Bindung an ein stromabwSrts oder -aufwarts gelegenes 
Element der Stof fwechselkaskade ftir Zellmembrankomponenten, 
welche die Desaturase umfasst, oder durch Bindxing an eine 

20 Desaturase, welche den Transport von Verbindungen tiber Zell- 
membranen vermittelt, heramen, wodxirch die Translokation geheramt 
wird. 

Bei einer alternativen Ausfiihrungsf orm koimen Homologe der 
Desaturase durch Sichten kombinatorischer Banken von Mutanten, 

25 z.B. Verkiirzungsmutcuiten, der Desaturase hinsichtlich Desaturase- 
Agonisten- oder -Antagonisten-Aktivitat identifiziert werden. Bei 
einer Ausfiihrungsf orm wird eine variegierte Bank von Desaturase- • 
Varianten durch kombinatorische Mutagenese auf NukleinscLure- 
ebene erzeugt und d\irch eine variegierte Genbank kodiert. Eine 

30 variegierte Bank von Desaturase-Varianten kemn z.B. durch 

enzymatische Ligation eines Gemisches von synthetischen Oligo- 
nukleotiden in Gensequenzen hergestellt werden, so dass sich 
ein degenerierter Satz potentieller Desaturase-Sequenzen als 
individuelle Polypeptide oder altemativ als Satz graSerer 

35 Fusionsproteine (z.B. far das Phage-Display) , die diesen Satz 
von Desaturase-Secjuenzen enthalten, exprimieren lasst. Es gibt 
eine Vielzahl von Verfahren, die zur Herstellung von Banken 
potentieller Desaturase-Homologen aus einer degenerlerten 
Oligonukleotidsequenz verwendet werden k6nnen. Die chemische 

40 Synthese einer degenerierten Gensequenz kann in einem DNA- 
Syntheseautomaten durchgeftttirt und das synthetische Gen dann 
in einen geeigneten E^qpressionsvektor ligiert werden. Die Ver- 
wendung eines degenerierten Satzes von Genen ermSglicht die 
Bereitstellung sSmtlicher Sequenzen, die den gewCLnschten Satz 

45 an potentiellen Desaturase-Sequenzen kodieren, in einem Gemisch. 
Verfahren zur Synthese degenerierter Oligonukleotide sind im 
Fachgebiet bekannt (siehe z.B. Narang, S.A, (1983) Tetrahedron 
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39:3; Itakura et al, (1984) Annu. Rev. Biochem. 53:323; Itakura 
et al., (1984) Science 198:1056; Ike et al. (1983) Nucleic Acids 
Res. 11:477) . 

5 Zusatzlich konnen Banken von Desaturase-Fragmenten zur Her- 

stelliing einer variegierten Population von Desaturase-Fragmenten 
ftir das Sichten und fiir die anschliefiende Selektion von Homo- 
logen einer Desaturase verwendet werden. Bei einer Ausftihrungs- 
form kann eine Bank von Fragmenten der kodierenden Seguenz durch 

10 Behandeln eines doppelstr&igigen PCR-Fragmentes einer kodierenden 
Desaturase-Sequenz mit einer Nuklease unter Bedingungen, unter 
denen Doppelstrangbrilche nur etwa einmal pro Molekiil erfolgen, 
Denaturieren der doppelstr&igigen DNA, Renaturieren der DNA \inter 
Bildung doppelstrangiger DNA, welche Sense/Antisense-Paare von 

15 verschiedenen Produkten mit Doppelstrangbrtichen \imfassen kann, 
Entf emen einzelstrSngiger Abschnitte aus neu gebildeten Duplices 
durch Behandlung mit Sl-Nuklease und Ligieren der result ierenden 
Fragmentbank in einen Expressionsvektor erzeugt werden. Mit 
diesem Verfahren kann eine Expressionsbank hergeleitet werden, 

20 die N-terminale, C-terminale und interne Fragmente der Desaturase 
verschiedener Grb&en kodiert. 

Im Fachgebiet sind raehrere Techniken fiir das Sichten von Gen- 
produkten in kombinatorischen Banken, die durch Punktmutationen 

25 Oder Verktirzung hergestellt worden sind, und ftir das Sichten von 
cDNA-Banken nach Genprodukten mit einer ausgewahlten Eigenschaft 
bekannt. Diese Techniken lassen sich an das schnelle Sichtung 
der Genbanken anpassen, die durch kombinatorische Mutagenese 
von Desaturase-Homologen erzeugt worden sind. Die am hMufigsten 

30 verwendeten Techniken zum Sichtung grofier Genbanken, die einer 
Analyse mit hohem Durchsatz unterworfen werden konnen; um- 
fassen gewdhnlich das Klonieren der Genbank in replizierbare 
Express ionsvektoren, Trans formier en von geeigneten Zellen mit der 
resultierenden Vektorenbank und Exprimieren der kombinatorischen 

35 Gene unter Bedingungen, unter denen der Nachweis der gewiinschten 
Aktivitat die Isolation des Vektors, der das Gen kodiert, dessen 
Produkt nachgewiesen wurde, erleichtert. RecTirsive-Ensemble-Muta- 
genese (REM) , eine neue Technik, die die HSuf igkeit funktioneller 
^futanten in den Banken erhoht, kann in Kombination mit den 

40 Sichtungstests zur Identifikation von Desaturase-Homologen ver- 
wendet werden (Arkin und Yo'urvan (1992) Proc. Natl. Acad. Sci. 
USA 89:7811-7815; Delgrave et al. (1993) Protein Engineering 
6(3) :327-331) . 

45 Eine weitere bekannte Technik zur VercLnderxing von katalytischen 
Eigenschaften von Enzymen bzw. deren codierenden Genen ist 
das *Gen-Shuf fling* (siehe z.B. in Stemmer, PNAS 1994, 91: 
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10747-10751, WO9720078 oder W09813487), das eine Kombination von 
Genfragmenten darstellt, wobei diese Neukombination zuscltzlich 
noch durch fehlerhafte Polymerasekettenreaktionen variiert werden 
kaiin xrnd somit eine hohe zu testende Sequenzdiversitat schafft. 
5 Voraussetzting ftir den Einsatz eines solchen Ansatzes ist jedoch 
ein geeignetes Screeningsystem, \m die erstellte GendiversitcLt 
auf Fimktionalitat zu Oberpriifen. 

Insbesondere fiir die Sichtung von DesaturaseaktivitSten 
10 ist ein Sichtungsverfahren Voraussetzung, das PUFA-abhangig 
Enzymaktivitat (en) erfafit. Bzgl. Desaturaseaktivitaten mit 
Spezifitat ftir PUFAs kann man in Mucor-Species, die durch 
bekannte Trans format ions verfahr en mit gewOnschten Genkonstrukten 
trans formier bar sind, die Toxizitat von Arachidonsclure in An- 
15 wesenheit eines toxischen Metaboliten (hier: SalicylsSure oder 
Salicylsaurederivate) nutzen (Eroshin et al., Mikrobiologiya, 
Vol. 65, No.l 1996, Seiten 31-36), um eine wachstumsbasierte 
Erstsichtung durchzuf iihr en . Resultierende Klone koxuien dann einer 
Analyse ihrer Lipidinhaltstof fe mittels Gaschromatographie und 
20 Massenspektroskopie unterzogen werden, um Edukte und Produkte in 
Art und Menge zu erfassen. 

Bei einer weiteren Ausfuhrungsform konnen Tests auf Zellbasis 
zur Analyse einer variegierten Desaturase-Bank unter Verwendung 
25 von weiteren im Fachgebiet bekannten Verfahren ausgenutzt werden . 

E, Erfindungsgemafie Verwendungen und Verfahren 

Die hier beschriebenen NukleinsSTiremolekUle , Proteine, Protein- 

30 hoiDologen, Fusionsproteine, Primer, Vektoren und Wirtszellen 
kSnnen bei einem oder mehreren der nachstehenden Verfahren ver- 
wendet werden: Identifikation von Phaeodactylum und verwandten 
Organismen, Kartierung der Genome von Organismen, die mit 
Phaeodactylum tricomutum verwandt sind, Identifikation und 

35 Lokalisierung von Phaeodactylum tricomutum-Sequenzen von 

Interesse, Evolutionsstudien, Bestimmung von Desaturase-Protein- 
bereichen, die fttr die Funktion notwendig sind, Modulation einer 
Desaturase-Aktivitat; Modulation des Stof fwechsels einer oder 
mehrerer Zellmembrankomponenten; Modulation des Transmembran- 

40 trctnsports einer oder mehrerer Verbindungen sowie Modulation der 
zelluiaren Produktion einer gewOnschten Verbindung, wie einer 
Feinchemikalie . Die erfindungsgemSfien Desaturase-Nukleins^ure- 
molek\ile haben eine Vielzahl von Verwendungen. Sie kdnnen 
zunSlchst zur Identifikation eines Organismus als Phaeodactylum 

45 tricomutum oder als naher Verwandter davon verwendet werden. Sie 
kttnnen auch zur Identifikation des Vorliegens von Phaeodactylum 
tricomutum oder eines Verwandten davon in einer Mischpopulation 
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von Mikroorganismen verwendet werden. Die Erfindung stellt die 
NukleinsS.uresec[uenzen einer Reihe von Phaeodactylum tricomutum- 
Genen bereit; durch Sondieren der extraihierten genomischen DNA 
einer Kultur einer einheitlichen oder gemischten Population von 
5 Mikroorganismen unter stringenten Bedingungen mit einer Sonde, 
die einen Bereich eines Phaeodactylum tricornutim -Gens oder von 
Teilen davon (iberspannt, das ftir diesen Organismus einzigartig 
xst, kann man bestimmen, ob dieser Organismus vorliegt. Phaeo- 
dactylum tricomutum selbst werden zur kommerziellen Produktion 
10 mehrfach langesattigter Sauren verwendet und eignen dariiber hinaus 
zur PUFA-Produktion auch in anderen Organismen insbesondere wenn 
erreicht werden soil, dass resultierende PUFAs auch in die Tri- 
acylglycerolfraktion eingebaut werden sollen. 

15 Ferner konnen die erf indxingsgemaSen Nukleinsaure- und Protein- 
molekttle als Marker far spezifische Bereiche des Genoms dienen. 
Dies ist nicht nur zur Kartierung des Genoms, sondem auch fur 
f\inktionelle Phaeodactylum tricornutum-Proteinen geeignet- Zur 
Identifikation des Genombereichs, an den ein bestimmtes DNA- 

20 bindendes Protein von Phaeodactylum tricomutum bindet, kSnnte 
das Phaeodactylxna tricomutum-Genom zum Beispiel gespalten werden 
und die Fragmente mit dem DNA-bindenden Protein inkubiert werden. 
Diejenigen, die das Protein binden, konnen zusatzlich mit den 
erf indungsgemSfien Nukleinseluremolekiilen, vorzugsweise mit leicht 

25 nachweisbaren Markierungen, sondiert werden; die Bindung eines 
solchen Nukleinsauremolekiils an das Genomfragment erraoglicht die 
Lokalisierung des Fragments auf der Genorakarte von Phaeodactylum 
tricomutum und erleichtert, wenn dies mehrmals mit unterschied- 
lichen Enzymen durchgeftihrt wird, eine rasche Bestimmung der 

30 Nukleihsauresequenz, an die das Protein bindet. Die erfindungs- 
gemaSen NukleinsSuremolekCile kOnnen zudem ausreichend homolog 
zu den Sequenzen verwandter Arten sein, dass diese NukleinsSure- 
molektlle als Marker ftir die Konstruktion einer genomischen Karte 
bei verwandten Pilzen oder Algen dienen kSnnen. 

35 

Die erf indungsgemaiSen Desaturase-Nukleinsauremolek\ile eignen 
sich auch ftir Evolutions- und Proteinstiruktur-Untersuchungen. 
Die Stof fwechsel- und Transportprozesse, an denen die er- 
findungsgemaSen Molekiile beteiligt sind, werden von vielen 

40 prokaryotischen und eukaryotischen Zellen genutzt; durch 
Vergleich der Sequenzen der erf indungsgem^Sen Nukleinsaure- 
molekdle mit solchen, die cLhnliche Enzyme aus anderen Orgsuiismen 
kodieren, kann der Evolutions -Verwandschaftsgrad der Organismen 
bestimmt werden. Entsprechend ermSglicht ein solcher Vergleich 

45 die Bestimmung, welche Sequenzbereiche konserviert sind und 
welche nicht, was bei' der Bestimmung von Bereichen des Proteins 
hilfreich sein kann, die ftb: die Enzymfunktion essentiell sind. 
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Dieser Typ der Bestimmimg ist fvir Proteinengineering-Unter- 
suchungen wertvoll und kann einen Hinweis darauf geben, wieviel 
Mutagenese das Protein tolerieren kaim, ohne die Fiinktion zu 
verlieren. 

5 

Die Manipulation der erf indungsgem^Sen Desaturase-NukleinsSure- 
luolekaie kann zur Produktion von Desaturasen mit fiinktionellen 
Unterschieden zu den Wildtyp-Desaturasen fiihren. Die Effizienz 
Oder Aktivitat dieser Proteine kann verbessert sein, sie k6nnen 

10 in grofieren Anzahlen als gewahnlich in der Zelle zugegen sein, 
Oder ihre Effizienz oder AktivitSt kann verringert sein. Ver- 
besserte Effizienz oder AktivitSt bedeutet beispielsweise, dass 
das Enzyia eine h6here Selektivitat und/oder AktivitSt, vorzugs- 
weise eine mindestens 10 % habere, besonders bevorzugt eine 

15 mindestens 20 % hohere AktivitSt, ganz besonders bevorzugt eine 
mindestens 30 % habere Aktivitat als das ursprtingliche Enzym 
aufweist . 

Es gibt eine Reihe von Mechanismen, durch die die VerSnderung 

20 einer erf indungsgemaEen Desaturase die Ausbeute, Produktion 
und/oder Effizienz der Produktion einer Feincbemikalie, welche 
ein solches verandertes Protein enthalt, direkt beeinflussen 
kann. Die Gewinnung von Feinchemikalien-Verbindungen aus Kulturen 
von Ciliaten, Algen oder Pilzen im groSen MaEstab ist signifi- 

25 kant verbessert, wenn die Zelle die gewiinschten Verbindungen 

sezerniert, da diese Verbindungen aus dem Kulturmedium (im Gegen- 
satz zur Extraktion aus der Masse der gezUchteten Zellen) leicht 
gereinigt werden kannen, Ansonsten ISsst sich die Reinigxmg ver- 
bessem, wenn die Zelle in vivo Verbindungen in einem speziali- 

30 sierten Kompartiment mit einer Art Konzentrationsmechanismus 
speichert. Bei Pflanzen, die Desaturasen exprimieren, kann ein 
gesteigerter Transport zu besserer Verteilung innerhalb des 
Pflanzengewebes und der -organe fOhren. Durch VergrdlSern der 
Anzahl oder der Aktivitat von Transportermolekulen, welche Fein- 

35 chemikalien aus der Zelle exportieren, kantn es maglich sein, die 
Menge der produzierten Feinchemikalie, die im extrazelluiaren 
Medium zugegen ist, zu steigem, wodurch Ernte und Reinigung oder 
bei Pflanzen eine effizientere Verteilung erleichtert werden. Zur 
effizienten Oberproduktion einer oder mehrerer Feinchemikalien 

40 sind dagegen erhahte Mengen an Cofaktoren, VorlSuf ermolekaien und 
Zwischenverbindungen fUr die geeigneten Biosynthesewege erforder- 
lich. Durch Vergrofiem der Anzahl und/oder der Aktivitat von 
Transporterprot einen, die am Import von NShrstoffen, wie Kohlen- 
stoffquellen (d.h. Zuckem) , Stickstof fquellen (d.h, Aminosauren, 

45 Ammoniumsalzen) , Phosphat und Schwefel, beteiligt sind, kann 

man die Produktion einer Feinchemikalie aufgrimd der Beseitigung 
aller Einschrankungen des Nahrstof fangebots beim Biosynthese- 
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prozess verbessem. Fettsauren, wie PUFAs, und Lipide, die PUFAs 
enthalten, sind selbst wCLnschenswerte Feincheitiikalien; durch 
Optimieren der Aktivitelt oder ErhShen der Anzahl einer oder 
mehrerer erf indungsgemaSer Desaturasen, die an der Biosynthese 
5 dieser Verbindungen beteiligt sind, oder durch StSren der Aktivi- 
tSit einer oder mehrerer Desaturasen, die am Abbau dieser Ver- 
bindungen beteiligt sind, kann man somit die Ausbeute, Produktion 
und/oder Effizienz der Produktion von Fettsaure- tind Lipidmole- 
kiile in Ciliaten, Algen, Pflanzen, Pilzen, Hefen oder amderen 
10 Mikroorganismen steigern. 

Die Manipulation eines oder mehrerer erfindungsgemaEer 
Desaturase-Gene kann ebenfalls zu Desaturasen mit veranderten 
Aktivitaten fiihren, welche die Produktion einer oder mehrerer 

15 gewunschter Feinchemikalien aus Algen, Pflanzen, Ciliaten oder 
Pilzen indirekt beeinf lussen. Die normalen biochemischen Stoff- 
wechselprozesse fiihren z.B. zur Produktion einer Vielzahl an 
Abfallprodukten (z.B. Wasserstof fperoxid und andere reaktive 
Sauerstof f spezies) , die diese Stoff wechselprozesse aktiv storen 

20 konnen (z.B. nitriert Peroxynitrit bekanntlich Tyros in-Seit en- 
ketten, wodurch einige Enzyme mit Tyrosin im aktiven Zentrum 
inaktiviert werden (Groves, J.T. (1999) Curr. Opin. Chem. Biol. 
3 (2) ,-226-235) ) . Diese Abfallprodukte werden zwar ublicherweise 
ausgeschieden, aber die zur fermentativen Produktion im groSen 

25 MaSstab verwendeten Zellen werden f<ir die Uberproduktion einer 
Oder mehrerer Feinchemikalien optimiert und konnen somit mehr 
Abfallprodukte produzieren als fiir eine Wildtypzelle ublich. 
Durch Optimieren der Aktivitat einer oder mehrerer erfindungs- 
gemaSer Desaturasen, die am Export von AbfallmolektLlen beteiligt 

30 sind; kann man die Lebensf ^igkeit der Zelle verbessern und 
eine effiziente Stof fwechselaktivitat aufrechterhalten. Auch 
das Vorliegen hoher intrazellul^rer Mengen der gewiinschten Fein- 
cheraikalie kann tatsSchlich filr die Zelle toxisch sein, so dass 
man durch Steigern der Fahigkeit der Zelle zur Sekretion dieser 

35 Verbindungen die Lebens fahigkeit der Zelle verbessern kann. 

Die erfindungsgemaiSen Desaturasen k6nnen ferner so manipuliert 
sein, dass die relativen Mengen verschiedener Lipid- und Fett- 
sSuremolekiile ver&idert werden. Dies kann eine entscheidende Aus- 

40 wirkiong auf die Lipidzusammensetzung der .Zellmembran haben. Da 
jeder Lipidtyp iinterschiedliche physikalische Eigenschaf ten hat, 
kann eine Ver&iderung der Lipidzusammensetzxing. einer Membran die 
Membranf luiditat signifikant verSndem. Anderungen der Membran- 
fluiditat k6nnen den Transport von MolektLlen iiber die Membran 

45 beeinf lussen, was, wie vorstehend erlSutert, den Export von 
Abfallprodukten oder der produzierten Feinchemikalie oder den 
Import notwendiger NSLhrstoffe modifizieren kann. Diese Anderungen 
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der Membranf luiditat kSnnen auch die Integritat der Zelle ent- 
scheidend beeinf lussen; Zellen mit vergleichsweise schwacheren 
Membranen sind anfailiger- gegeniiber abiotischen \ind biotischen 
Stressbedingungen, welche die Zelle beschadigen oder abtSten 
5 konnen. Durch Manipulieren von Desatxxrasen, die an der Produktion 
von Fettsauren luid Lipiden ftir den Membranaufbau beteiligt sind, 
so dass die resultierende Meiobran eine Mexnbranzusammensetzung 
hat, die fiir die in den Kulturen, die zur Produktion von Fein- 
chemikalien verwendet werden, herrschenden Umweltbedingvmgen 
10 empfSnglicher sind, sollte ein grofierer Anteil der Zellen aber- 
leben und si eh vermehren. GrSfiere Mengen an produzierenden 
Zellen sollten sich in grolSeren Ausbeuten, hoherer Produktion 
Oder Effizienz der Produktion der Feinchemikalie aus der Kultur 
manifestieren. 

15 

Die vorstehend genauinten Mutageneses trategien ftir Desaturasen, 
die zu erhohten Ausbeuten einer Feincheinikalie fiihren sollen, 
sollen nicht beschrankend sein; Variationen dieser Strategien 
sind dem Fachmann leicht ersichtlich. Unter Verwendung dieser 

20 Mechanismen und mithilfe der hier offenbarten Mechanismen kSnnen 
die erf indungsgemaSen Nukleinsaure- und Proteiimolekiile zur 
Erzeugung von Algen, . Ciliaten, Pflanzen, Tieren, Pilzen oder 
anderen Mikroorgani smen, wie C. glutamicum, verwendet werden, 
die mutierte Desaturase-Nukleinsaure- und Proteinmolelcule expri- 

25 mieren, so dass die Ausbeute, Produktion und/oder Effizienz der 
Produktion einer gewiinschten Verbindung verbessert wird. Diese 
gewunschte Verbindung kann ein beliebiges natiirliches Produkt von 
Algen, Ciliaten, Pflanzen, Tieren, Pilzen oder Bakterien sein, 
welches die Endprodukte von Biosynthesewegen und Zwischenprodukte 

30 natxirlich vorkoinmender Stof fwechselwege vmifasst, sowie MolekUle, 
die im Stof fwechsel dieser Zellen nicht natOrlich vorkoinmen, die 
jedoch von den erf indungsgemaSen Zellen produziert werden, 

Eine weitere erfindungsgemalSe Aus ftihrungs form ist ein Verfahren 
35 zur Produktion von PUFAs, wobei das Verfahren das Ziichten 

eines Organismus, der eine erf ind\mgsgemafie Nukleinsaure, ein 
erf indungsgemaSes Genkonstrukt oder einen erf indungsgemaSen 
Vektor umfasst, welche ein Polypeptid kodieren, das Cis-/ C20- 
oder C22'*'F^ttsauren mit mindestens zwei Doppelbindungen im 
40 Fettsauremolekiil urn mindestens zwei Kohlenstof fatome unter 
Bedingungen, unter denen PUFAs in dem Organismus produziert 
werden, veriangert, umfasst. Durch dieses Verfahren hergestellte 
PUFAs lassen sich diirch Ernten der Organismen entweder aus 
der Kultur, in der sie wachsen, oder von dem Feld, Aufbrechen 
45 und/oder Extrahieren des geemteten Mfeiterials mit einem 

organischen L5sungsmittel isolieren. Aus diesem L6sungsmlttel 
kann das Ol, das Lipide, Phospholipide, Sphingolipide, Glyco- 
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lipide, Triacylglycerine und/oder freie Fettsauren rait hoherem 
Gehalt an PUFAs entMlt, isoliert werden, Durch basische oder 
saure Hydrolyse der Lipide, Phospholipide, Sphingolipide, Glyco- 
lipide, Triacylglycerine konnen die freien Fettsauren mit hoherem 
5 Gehalt an PUFAs isoliert werden. Ein hoherer Gehalt an PUFAs 
bedeutet mindestens 5 %, vorzugsweise 10 %, besonders bevorzugt 
20 %, ganz besonders bevorzugt 40 % mehr PUFAs als der ursprttng- 
liche Organismus, der keine zusStzliche Nukleinsaure , die die 
erf indungsgemaSe Desaturase kodiert, besitzt. 

10 

Vorzugsweise sind die durch dieses Verfahren produzierten PUFAs 
Ci8- Oder C2o-22"F®ttsauremolekule mit mindestens zwei Doppel- 
bindungen im FettsSuremolekCil , vorzugsweise drei, vier, bei 
Kombination mit einer weiteren Elongasen \md einer A-4 Desaturase 
15 fiinf Oder sechs Doppelbindungen . Diese Cie- oder C2o-22""F^ttsaure- 
molekUle lassen sich aus dem Organismus in Form eines dls. Lipids 
Oder einer freien FettsMure isolieren. Geeignete Organismen sind 
beispielsweise die vorstehend erwSLhnten. Bevorzugte Organismen 
sind transgene Pflanzen. 

20 

Eine erf indixngsgemSfie Aus fiihrungs form sind 6le, Lipide oder Fett- • 
ScLuren oder Fraktionen davon, die durch das oben beschriebene 
Verfahren hergestellt worden sind, besonders bevorzugt 01, Lipid 
Oder eine Fettsaurezusammensetzxing, die PUFAs umfassen und von 
25 transgenen Pflanzen herrtihren. 

Eine weitere erf indungsgemaSe Aus fuhrungs form ist die Verwend\ing 
des 01s, Lipids oder der Fettsaurezusammensetzung in Futter- 
mitteln, Nahrungsmitteln, Kosmetika oder Pharmazeutika, 

30 

Ein weiterer Erf indungsgegenstand ist ein Verfahren zur 

Identif ikation eines Antagonisten oder Agonisten von Desaturasen, 

umfassend 

35 a) in Kontaktbringen der Zellen, die das Polypeptid der 

vorliegenden Erfindung exprimieren, mit einem Kandidaten- 
stof f ; 

b) Testen der Desaturaseaktivitclt; 

40 

c) Vergleichen der Desaturaseaktivitat mit einer Standard- 
aktivitat in Abwesenheit des Kandidatenstof fs, wobei ein 
Anstieg der Desaturaseaktivitat iiber den Standard anzeigt, 
dafi der Kandidatenstof f ein Agonist und ein Verringerung 

45 der Desaturaseaktivitat anzeigt, dafi der Kandidatenstof f 

ein Antagonist ist* 
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Der genannte Kandidatenstof f kann ein chemisch synthetisierter 
Oder itiikrobiologisch produzierter Stoff sein und z.B. in Zell- 
extrakten von z.B, Pflanzen, Tier en oder Mikroorganismen auf- 
treten. Weiterhin kann der genannte Stoff zwar im Stand der 
5 Technik bekannt sein, aber bisher nicht bekannt sein als die 
Aktivitat der Desaturasen steigemd oder repremierend. Djas Reak- 
tionsgemisch kann ein zellfreier Extrakt sein oder eine Zelle 
Oder Zellkultur umfassen. Geeignete Methoden sind dem Fachmann 
bekannt und werden z.B» allgemein beschrieben in Alberts, Mole- 
10 cular Biology the cell, S^d Edition (1994), z.B. Kapitel 17, Die 
genannten Stoff e kGnnen z.B. zu dem Reaktionsgemisch oder dem 
Kulturmediiam zugegeben werden oder den Zellen injiziert werden 
oder auf eine Pflanze gespr^iht werden. 

15 Wenn eine Probe, die ein nach der erfindungsgemSSen Methode 
aktiven Stoff beinhaltet, identifiziert wurde, dann ist es ent- 
weder rndglich, den Stoff direkt von der urspriinglichen Probe zu 
isolieren oder man kann die Probe in verschiedene Gruppen teilen, 
z.B, wenn sie aus einer Vielzahl von verschiedenen Komponenten 

20 besteht, urn so die Zahl der verschiedenen Substanzen pro Probe 
zu reduzieren und dann das erf indvmgsgemSEe Verfahren mit einer 
solchen "Unterprobe" der urspriinglichen Probe zu wiederholen. 
Abhangig von der Komplexitat der Probe konnen die oben beschrie- 
benen Schritte mehntials wiederholt werden, vorzugsweise bis die 

25 gemaS der erfindungsgemSSen Methode identifizierte Probe nur noch 
eine geringe Anzahl von Substanzen oder nur noch eine Substanz 
umfafit. Vorzugsweise wird der gernSE der erfindungsgem^lSen Methode 
identifizierte Stoff oder Derivate davon weiter formuliert, so, 
daS er f€Lr die Anwendung in der Pf lanzenztlchtung oder Pf lanzen- 

30 zell- Oder Gewebekultur geeignet ist. 

Die Stoff e, die gemSS dem erf indungsgemaSen Verfahren getestet 
xrnd identifiziert wurden, kQnnen sein: Expressionsbibliotheken, 
z.B. cDNA-Expressionsbibliotheken, Peptide, Proteine, NukleinsSu- 

35 ren, Antikdrper, kleine organische Stoff e, Hoirmone, PNAs oder 
ahnliches (Milner, Nature Medicin 1 (1995), 879-880; Hupp, Cell, 
83 (1995), 237-245; Gibbs, Cell. 79 (1994), 193-198 und darin 
zitierte Ref erenzen) . Diese Stof fe k6nne auch funktionelle 
Derivate oder Analogon der bekannten Inhibitoren oder Aktivatoren 

40 sein. Verfahren zur Herstellung von chemischen Derivaten oder 
Analogon sind dem Fachmann bekannt . Die genannten Derivate und 
Analogon kGnnen gemSE Verfahren nach dem Stand der Technik 
getestet werden. Weiterhin kann computergestiitztes Design oder 
Peptidomimetics zur Herstellung geeigneter Derivate xmd Analogon 

45 veirwendet werden. Die Zelle oder das Gewebe, die/das ftir das 
erf indxuigsgemafie Verfahren verwendet werden kann, ist vorzugs- 
weise eine erf indungsgemSLfie Wirtszelle, Pflanzenzelle oder ein 
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Pflanzengewebe, wie in den oben genannten Ausfiihrungsformen 
beschrieben. 

Entsprechend betrif ft die vorliegende Erfindung auch einen 
5 Stoff , der geitiSS den vorstehenden erf indungsgemalSen Verfahren 
identifiziert wurde. Der Stoff ist z.B. ein Homolog der 
erfindungsgemaSen DesatTirasen. Homologe der Desaturasen kSnnen 
durch Mutagenese, z.B, durch Punktmutation oder Deletion der 
Desaturasen, erzeugt werden. Hierin verwendet wird der Begriff 

10 "Homolog" als eine variante Form der Desaturasen, die als Agonist 
Oder Antagonist fur die Aktivitat der Desaturasen wirkt. Ein 
Agonist kann die im wesentlichen gleiche oder einen Teil der 
biologischen Aktivitat der Desaturasen haben. Ein Antagonist der 
Desaturasen kann eine oder mehr Aktivitaten der nattirlich vor- 

15 koiranenden Formen der Desaturasen inhibieren, z.B. kompetitiv an 
ein Downstream oder Upstream gelegenes Mitglied der FettsSure- 
synthese-Stoffwechselwege, die die Desaturasen einschliefien, 
binden oder an Desatixrasen binden und dabei die Aktivitat 
reduzieren oder inhibieren. 

20 

AuSerdem betriff t die vorliegende Erfindung auch ein Antik5rper 
Oder ein Fragment davon, wie sie hierin beschrieben werden, der 
die Aktivitat der erfindungsgemaSen Desaturasen inhibiert. 

25 Bei einem Aspekt betrif ft die vorliegende Erfindung ein Anti- 
korper, der spezifisch den erf indungsgemafien oben beschriebenen 
Agonisten oder Antagonisten erkeimt bzw. bindet. 

Ein weiterer Aspekt betrifft eine Zusammensetzung, die den Anti- 
30 kGrper, den nach dem erf ind\ingsgemaSen Verfahren identif izierten 
Stopp Oder das Antisense-Molekttl umfaSt. 

In einer weiteren AusfUhrimgsform betrifft die vorliegende 
Erfindung ein Kit, umfassend die erf indiingsgemafie NukleinsSure, 

35 das erf indungsgemMSe Genkonstrukt , die erfindungsgemafie Amino- 
sauresequenz, das erf indungsgemafie Antisense-Nukleinsauremolekiil, 
den erf indungsgemafien Antikorper und/oder Zusammensetzung, einen 
Antagonisten oder Agonisten, der nach dem erf indungsgemSSen Ver- 
fahren hergestellt wurde, und/oder erfindungsgemSLfie Ole, Lipide 

40 und/oder FettsSuren oder eine Fraktion davon. Ebenso kann das 
Kit die erf indungsgemafien Wirtszellen, Organismen, Pflanzen 
oder Telle davon, emtbare Telle der erfindungsgemaSen Pflanzen 
Oder Vermehrungsmaterial oder aber auch den erfindungsgemaiSen 
Antagonisten oder Agonisten umfassen. Die Komponenten des Kits 

45 der vorliegenden Erfindung k5nnen in geeigneten Containern, bei- 
spielsweise mit oder in Puf f ern oder anderen LSsungen verpackt 
sein. Ein oder mehr der genannten Komponenten k5nnen in ein und 
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demselben Container verpackt sein. Zusatzlich oder altemativ 
kOnnen ein oder mehr der genannten Komponenten z.B. auf einer 
festen Oberfiache adsorbiert sein, z.B. Nitrozellulosef ilter, 
Glasplatten, Chips, Nylornnembranen oder Mikrotiterplatten. Das 
5 Kit kann fUr jede der hierin beschriebenen Methoden und Aus- 
fiihrungsformen verwendet werden, z.B. fiir die Produktion von 
Wirtszellen, transgenen Pflanzen, zur Detektion von homologen 
Sequenzen, zur Identif ikation von Antagonisten oder Agonisten 
usw. Weiterhin kann das Kit Anleitxingen fur die Verwendung des 
10 Kits fiir eine der genannten Anwendungen en thai ten. 

Diese Erf indung wird durch die nachstehenden Beispiele weiter 
veranschaulicht, die nicht als beschrSnkend aufgefaSt werden 
soli ten. Der Inhalt samtlicher in dieser Patentanmeldung 
15 zitierten Literaturstellen, Patentanmeldungen, Patente und 
verdf fentlichten Patentanmeldungen ist hier durch Bezugnahme 
aufgenommen. 

Beispielteil 

20 

Beispiel 1: Allgemeine Verfahren 

a) Allgemeine Klonieriingsverfahren: 

25 Klonierungsverfahren, wie beispielsweise Restriktionsspaltungen, 
Agarosegelelektrophorese, Reinigung von DNA-Fragmenten, Transfer 
von NukleinsSuren auf Nitrocellulose- und Nylonmembranen, 
Verbindung von DNA-Fragitienten, Transformation von Escherichia 
coli- und Hefe-Zellen, Anzucht von Bakterien und Sequenzanalyse 

30 rekombinanter DNA, wurden durchgeftlhrt wie beschrieben in 
Sambrook et al. (1989) (Cold Spring Harbor Laboratory Press: 
ISBN 0-87969-309-6) oder Kaiser, Michaelis und Mitchell (1994) 
''Methods in Yeast Genetics" (Cold Spring Harbor Laboratory Press: 
ISBN 0-87969-451-3) • Die Transformation und Anzucht von Algen, 

35 wie Chlorella oder Phaeodactylxim werden durchgefOhrt wie be- 
schrieben von El-Sheekh (1999), Biologia Plantarum 42:209-216; 
Apt et al. (1996) Molecular and General Genetics 252 (5) :872-9- 

b) Chemikalien 

40 

Die verwendet en Chemikalieii wurden, wenn im Text nicht anders 
angegeben, in p, A,-Qualita.t von den Firmen Fluka (Neu-Ulm) , 
Merck (Darmstadt), Roth (Karlsruhe), Serva (Heidelberg) und 
Sigma (Deisenhofen) bezogen. L6s\ingen wurden vmter Verwendung 
45 von reinem pyrogenfreiem Wasser, im nachstehenden Text als H2O 
bezeichnet, aus einer* Milli-Q-Wassersystem-Wasserreinigungs- 
anlage (Millipore, Eschbom) hergestellt. Restriktionsendo- 
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nukleasen, DNA-modif izierende Enzyme und molekularbiologische 
Kits wurden bezogen von den Pirmen AGS (Heidelberg) , Amersham 
(Braunschweig) , Biometra (G6ttingen) , Boehringer (Mannheim) , 
Genomed (Bad Oeynhausen) , New England Biolabs (Schwalbach/ 

5 Taunus) , Novagen (Madison, Wisconsin, USA) , Perkin-Elmer 
(Weiterstadt) , Pharmacia (Freiburg) , Qiagen (Hilden) vuid 
Stratagene (Amsterdam, Niederlande) . Wenn nicht anders ange- 

. geben, wurden sie nach den Anweisungen des Hers tellers ver- 
wendet • 

10 

c) Zellmaterial 

Die erf indixngsgemSlfien isolierten Nukleinsauresequenzen sind im 
Genom eines Phaeodactylum tricomutum UTEX646-Stainmes enthalten, 
15 der tiber die Algensammlung der University of Texas, Austin ver- 
ftlgbar ist. 

Phaeodactylum tricomutum wurde bei 25°C mit einem Licht/Dunkel 
Rhythmus von 14:10 Stunden bei 22^C und 35 microEinstein (ent- 
20 spricht micromol Photonen pro Quadra tmeter \md Sekunde) in Glas- 
rShren kultiviert, die von unten mit Luft begast wurden. 

Als Kulturmedium fiir Phaeodactylum tricomutum wurde das f /2 
Kulturmedixm mit 10 % organischen Medium nach Guillard, R.R.L. 
25 verwendet (1975; Culture of phytoplankton for feeding marine 
invertebrates. In: Smith, W.L. and Chanley, M.H. (Eds.) Culture 
of marine Invertebrate animals, NY Plenum Press, pp. 29-60.): 
Es enthS.lt 

30 995,5 ml Seewasser (artif iziell) 

1 ml NaNOa (75 g/1), 1 ml NaH2P04 (5 g/1) , 1 ml Spurenelemente- 
16sung, 1 ml Tris/Cl pH 8.0, 0.5 ml f/2 Vitaminlosxmg 

Spurenelementeldsung: Na2EDTA (4,36 g/1)/ FeCla (3,15 g/l), 
35 Primare Spurenelemente : CuS04 (10 g/1), ZnS04 (22 g/1), C0CI2 
(10 g/1), MnCl2 (18 g/1), NaMo04 (6,3 g/1) 

f/2 Vitaminlosung: Biotin: 10 mg/1, Thiamin 200 mg/1, Vit Bl2 
0,1 mg/1 

org-MediTJon: Na-Acetat (1 g/1). Glucose (6 g/1), Na-Succinat 
40 (3 g/1), Bacto-Trypton (4 g/1), Hefe-Extrakt (2 g/1) 



45 
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Beispiel: 2 Isolierung von Gesamt-DNA aus Phaeodactylum tri- 
comutum UTEX646 fttr Hybridisierungs experiment e 

Die Einzelheiten der Isolier\ing von Gesamt-DNA betreffen die Auf- 
5 arbeitung von Pflanzenmaterial mit einem Frischgewicht von einem 
Gramm. 

CTAB-Puffer: 2 % (Gew./Vol.) N-Acetyl-N/N,N-trimethylainnioniuin- 
bromid (CTAB) ; 100 mM Tris-HCl, pH 8,0; 1,4 M NaCl; 20 mM EDTA. 

10 

N-Laurylsarkosin-Puffer: 10 % (Gew./Vol.) N-Laurylsarkosin; 
100 mM Tris-HCl, pH 8,0; 20 mM EDTA. 

Phaeodactylim tricornutiim-Zellmaterial vmrde unter flussigem 

15 Stickstof f in einem Mdrser verrieben, so dass ein feines Pulver 
erhalten wurde, und in 2 ml-EppendorfgefaSe ttberfahrt. Das ge- 
frorene Pflanzenmaterial wurde dann mit einer Schicht von 1 ml 
Zersetzungspuffer (1 ml CTAB-Puffer, 100 ml N-Laurylsarkosin- 
Puffer, 20 ml S-Mercaptoethanol und 10 ml Proteinase K-L5sung, 

20 10 mg/ml) (iberschichtet und eine St\mde unter kontinuierlichem 
Schiitteln bei 60°C inkubiert. Das erhaltene Homogenat wurde 
in zwei EppendorfgefS.Ee (2 ml) aufgeteilt und zweimal durch 
Schiitteln mit dem gleichen Volumen Chloroform/ Isoamylalkohol 
(24:1) extrahiert. Zur Phasentrennung wurde eine Zentrifugation 

25 bei 8000 x g und RT (= Raumtemperatur = - 23**C) jeweils 15 min" 
lang durchgef tlhrt . Die DNA wurde dann 30 min unter Verwendung von 
eiskaltem Isopropanol bei -70°C gefallt. Die gefailte DNA wurde 
bei 10000 g 30 min bei 4**C sedimentiert und in 180 ml TE-Puffer 
(Sambrook et al., 1989, Cold Spring Harbor Laboratory Press: ISBN 

30 0-87969-309-6) resuspendiert . Zur weiteren Reinigung wurde die 
DNA mit NaCl (1,2 M Endkonzentration) behandelt und erneut 30 min 
iinter Verwendiing des zweifachen Volumens an absolutem Ethanol bei 
-70°C gefallt. Nach einem Waschschritt mit 70 % Ethanol wurde die 
DNA getrocknet und anschlieSend in 50 ml H2O + RNAse (50 mg/ml 

35 Endkonzentration) aufgenommen. Die DNA wurde tiber Nacht bei 4°C 
gel6st und die RNAse-Spaltung wurde anschlielSend 1 Std. bei 
37*C durchgef tlhrt . Die Aufbewahrung der DNA erfolgte bei 4°C. 

Beispiel 3: Isolierung von Gesamt-RNA und poly (A) +-RNA aus 
40 Pflanzen und Phaeodactylum tricornutum 

Die Isolierung von Gesamt-RNA aus Pflanzen wie Lein und Raps 
etc. erfolgt nach einer bei Logemann et al beschriebenen 
Methode (1987, Anal. Biochem. 163, 21) isoliert. Aus Moos kann 
45 die Gesamt-RNA Protonema-Gewebe nach dem GTC-Verfahren (Reski 
et al., 1994, Mol. Gen. Genet., 244:352-359) gewonnen werden. 
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RNA Isolierung aus Phaeodactylum tricornutijm: 

Tiefgefrorene Algenproben (- 70°C) wurden in einem eiskaltem 
Morser iinter Fltissigstickstof f zu f einem Pulver zerreiben. 
5 2 Volumen Homogenisationsmeditim (12,024 g Sorbitol, 40,0 ml IM 
Tris-HCl, pH 9 (0,2 M) ; 12,0 ml 5 M NaCl (0,3 M) , 8,0 ml 250 mM 
EDTA, 761,0 mg EGTA, 40,0 ml 10 % SDS wurden auf 200 ml mit H2O 
aufgeftlllt und der pH auf 8,5 eingestellt) und 4 Volumen Phenol 
mit 0,2 % Mercaptoethanol wurden bei 40 bis 50°C unter gut em 
10 Mischen zu gefrorenem Zellpulver gegeben. Danach wurden 2 Vol\imen 
Chloroform hinzufiigen und fiir 15 min krSlftig gertthrt. Es wurde 
10 min bei 10000 g zentrifugiert und die wcLssrige Phase mit 
Phenol /Chloroform (2 Vol) iind abschlieSend mit Chloroform 
extrahiert . 

15 

Das erhaltene Volumen der wSssrigen Phase wurde mit 1/20 Vol 
4 M Na-Acetat (pH 6) und 1 Vol Isopropanol (eiskalt) versetzet 
und die NukleinsSuren bei -20^C liber Nacht (= UN) gefallt. 
AnschlieSend wurde 30 min bei 10000 g zentrifugiert und der 

20 fibers tand abgesogen, Es folgte ein Waschschritt mit 70 % EtOH 
und emeute Zentrifugation. Das Sediment wurde in Tris-Borat- 
Puffer (80 mM Tris-Borat-Puf fer, 10 mM EDTA, pH 7,0) aufgenommen. 
Dann wurde der (Jberstand mit 1/3 Vol 8 M LiCl versetzt, gemischt 
30 min bei 4°C inkubiert. Nach erneutem zentrifugieren wurde 

25 das Sediment mit 70 % Ethemol gewaschen, zentrifugiert und das 
Sediment in KNAse-freiem Wasser geldst. 

Die IsolierxHig von poly(A)+-RNA er folgte unter Verwendung von Dyna 
Beads® (Dynal, Oslo, Finnlsind) nach den Anweisungen im Protokoll 
30 des Herstellers. 

Nach der Bestimmung der RNA- oder poly (A) '♦'-RNA-Konzentration wurde 
die RNA durch Zugabe von 1/10 Volumina 3 M Natriumacetat , pH 4,6, 
und 2 Volumina Ethanol gefSllt und bei -70*C aufbewahrt. 

35 

Fiir die Analyse wurden jeweils 20 \ig RNA in einem Formaldehyd- 
haltigen l,5%igen Agarosegel aufgetrennt und auf Nylon 
Membranen (Hybond, Amersham) tiberftihrt. Der Nachweis spezifischer 
Transkripte wurde wie bei Amasino beschrieben durchgefiilirt 
40 ((1986) Anal. Biochem. 152, 304)). 

Beispiel 4: Konstruktion der cDNA-Bank 

Zur Konstiruktion der cDNA-Bank aus Phaeodactyliam tricornutum 
45 wurde die Erststrangsynthese unter Verwendung von Reverser 
Trsuisloriptase aus Maus-LeukSmie-Virus (Roche, Mannheim, 
Deutschland) und Oligo-d(T)-Primem, die Zweitstremgsynthese 
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durch Inkubation mit DNA-Polymerase I, Klenow-Enzym und RNAse 
H-Spalt\mg bei'l2*C (2 Std.), 16**C (1 Std.) und 22**C (1 STd.) 
erzielt. Die Reaktion wurde durch Inkubation bei 65**C (10 min) 
gestoppt und anschliefiend auf Eis liberfuhrt. Doppelstr^ngige DNA- 
5 MolekUle wurde mit T4-DNA-Polymerase (Roche, Mannheim) bei 37°C 
(30 min) mit glatten Enden versehen. Die Nukleotide wurden durch 
Phenol/Chloroform-Extraktion und Sephadex-GSO-ZentrifugiersSulen 
entfemt. EcoRI/XhoI-Adapter (Pharmacia, Freiburg, Deutschland) 
wurden mittels T4-DNA-Ligase (Roche, 12°C, iiber Nacht) an die 

10 cDNA-Enden ligiert, mit Xhol nachgeschnitten und durch Inkubation 
mit Polynukleotidkinase (Roche, 37®C, 30 min) phosphoryliert , 
Dieses Gemisch wurde der Trennung auf einem Low-Melting-Agarose- 
Gel unterworfen. DNA-MolekCile uber 300 Basenpaaren wurden aus dem 
Gel eluiert, Phenol -extrahiert, auf Elutip-D-Saulen (Schleicher 

15 \ind Schull/ Dassel, Deutschland) konzentriert und an Vektorarme 
ligiert und in lambda-ZAP-Express-Phagen unter Verwendung des 
Gigapack Gold-Kits (Stratagene, Amsterdam, Niederlande) verpackt, 
wobei Material des Herstellers verwendet und seine Anweisungen 
befolgt wurden. 

20 

Beispiel 5: DNA-Sequenzierung und Computeranalyse 

cDNA-Banken, wie im Beispiel 4 beschrieben, wurden zur DNA- 
Sequenzierung nach Standardverfahren, insbesondere durch das 

25 Kettenterminationsverfahren unter Verwendung des ABI PRISM Big 
Dye Terminator Cycle Sequencing Ready Reaction-Kit (Perkin- 
Elmer, Weiterstadt, Deutschland), verwendet. Die Sequenzierung 
zufalliger, vereinzelter Klone wurde anschliefiend an die 
preparative Plasmidgewinnung aus cDNA-Banken fiber in vivo-Massen- 

30 excision und Re trans formation von DHIOB auf Agarplatten durch- 
gef<ihrt (Einzelheiten zu Material und Protokoll von Stratagene, 
Amsterdam, Niederlande) , Plasmid-DNA wurde aus Ober Nacht 
gezachteten E. coli-Kulturen, die in Luria-Brtihe mit Ampicillin 
(siehe Sambrook et al. (1989) (Cold Spring Harbor Laboratory 

35 Press: ISBN 0-87969-309-6)) geziichtet worden waren, an einem 
Qiagen-DNA-Prfiparations-Roboter (Qiagen, Hilden) nach den 
Protokollen des Herstellers prapariert. Sequenzierprimer mit 
den folgenden Nukleotidsequenzen wurden verwendet: 

40 5 ' -CAGGAAACAGCTATGACC-3 ' 
5 ' -CTAAAGGGAACAAAAGCTG-3 ' 
5 ' -TGTAAAACGACGGCCAGT-3 ' 

Die Sec[uenzen wurden unter Verwendung des Standard-Sof twarepa- 
45 kets EST-MAX, das koramerziell von Bio-Mcix (Miinchen, Deutschland) 
geliefert wird, prozessiert und annotiert. Durch Nutztang von 
Vergleichsalgorithmen xmd unter Verwendung der in SEQ ID NO: 8 
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dargestellten Suchsequenz wurde mithilfe des BLAST-Prograinms nach 
homologen Genen gesucht (Altschul et al. (1997) 'Gapped BLAST and 
PSI-BLAST: a new generation of protein database search programs", 
Nucleic Acids Res. 25:3389-3402.), Zwei Sequenzen aus Phaeo- 
5 dactylum tricomutiom mit Homologien zur Suchsequenz aus Physco- 
mitrella patens wurden eingehender charakterisiert . 

Beispiel 5a: Isolation von Desciturasen aus Phaeodactylum tri- 
cornutum iiber Polymerase Kettenreaktion mithilfe 
10 degenerierter Oligonukleotide : 

Mithilfe von publizierten Desaturasen konnen Motive identif iziert 
werden, die fiir A-5 und A-S Desaturasen typisch sind. Im folgen- 
den sind Oligonukleotidsequenzen mit moglichen Variationen dar- 

15 gestellt. Unter der Oligonukleotidsequenz ist im Ein-Buchstaben- 
code die Aminos^iire dargestellt, von der die Basenkombination 
abgeleitet werden kann. Z.B. bedeutet A/G, dafi an dieser Position 
bei der Synthese des Bausteins statistisch gleichverteilt ent- 
weder ein A oder ein G in das Oligonukleotid eingebaut wird, 

20 da das von der korrespondierenden AminosSure sdogeleitete Basen- 
triplett entweder ein AAA oder ein AAG sein kann. Die DNA Sequenz 
kann auch ein Inosin (i) enthalten, wenn die Bestimmung einer 
Base an dieser Position aufgrund des genetischen Codes drei 
Oder vier unterschiedliche Basen erlaubt. Folgende Secjuenzen 

25 und Primer kSnnen verwendet werden: 



5 ' -Vorwarts-Primer : 





Fla: 


TGG 


TGG 


AA A/G 


TGG 


AAi CA T/C AA 






Fib: 


TGG 


TGG 


AA A/G 


TGG 


ACi CA T/C AA 




30 


Fla: 


W 


W 


K 


W 


N/T H K/N 






Fib: 


W 


w 


K 


W 


K H * K/N 






F2a: 


Gi 


TGG 


AA A/G 


GAi 


A/C Ai CA T/C AA 






F2b: 


Gi 


TGG 


AA A/G 


TTG 


A/C Ai CA T/C AA 




35 


F2a: 


G/W 


W 


K 


E/D 


K/Q/N H K/N 






F2b: 


G/W 


W 


K 


W 


K/Q/N H K/N 






F3a: 


T A/T i 


TTG 


AAi 


A/C A A/G C/A G/A i 


CA 




F3b: 


T A/T i 


TTG 


AAi 


A/C A A/G CAi 


CA 




F3a: 


W 




W 


K/N 


H/N R/Q 


H 


40 


F3b: 


Y 




W 


K/N 


H/N . R/Q 


H 




F4a: 




GTi TGG A A/T G/A GA A/G CA A/G 


CA 




F4b: 




GTi TGG A A/T G/A A/T A T/C CA A/G 


CA 




F4a: 




V 


w 


K/M 


E Q 


H 




F4b: 




V 


w 


K/M 


N/Y Q 


H 


45 


FSal: 




CA 


T/C TA T/C TGG AA A/G AA T/C CA G 


C 




F5al: 




CA T/C TA T/C TGG AA A/G AA T/C CA A 


C 




FSal: 




H 




Y 


W K N Q 


H/Q 
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F6a: TTG TTG AAi 
F6a: W W K/N 

3 ' - Reverse Primer 



5 Rib: GG A/G AA 

Rib: GG A/G AA 

Rla: P F 

Rib: P F 

R2al: AA iAG 

10 R2a2: AA T/C AA 

R2al : F L 

R3al: AT iTG 

R3a2: AT A/G TT 

R3a3 : AT iTG 

15 R3a4: . AT A/G TT 

R3al: I/M H/Q 

R3a2: I/M N 

R4al : CT 

R4a2 : GA 
20 R4a3: GT 

R4al: = T/R/S 

R5al: AA iAA 

R5a2: 2\A iAG 

R5al: F F H 

25 R5a2: F L H 

R6al: T iGG iA A/G 

R6al: T iGG iA A/G 

R6al: T/N P L 



H E I Q 

H E I Q 

iAA A/G TG A/G TG iAC 

iAG A/G TG A/G TG iAC 

F/L H H V 



80 

A/C A A/G AA i CA T/C AA 

H/N K/N H K/N 



iAG G/A TG G/A TG T/C TC 

iAA G/A TG G/A TG T/C TC 

L H H E 

' F H H E 

A/G TG A/G TG iA C/T iA/G T/C TG 

A/G TG A/G TG iA C/T iA/G T/C TG 

H H V/I V/A Q 

iGG A/G AA iAA A/G TG A/G TG 

iGG A/G AA iAA A/G TG A/G TG 

iGG A/G AA iAG A/G TG A/G TG 

iGG A/G AA iAG A/G TG A/G TG 

P F F H H 

P F L H H 

iGG A/G AA iA A/G A/G TG A/G TG 

iGG A/G AA iA A/G A/G TG A/G TG 
iGG A/G AA iA A/G A/G TG A/G TG 

P F F/L H H 

A/G TG A/G TG T/C TC T/A/G AT T/C 

A/G TG A/G TG T/C TC T/A/G AT T/C 



3Q Aufgrund verschiedener Variationsmoglichkeiten sind viele 

abgeleitete Oligonukleotide moglich, jedoch tiberraschenderweise 
gefunden wurde, dass dargestellte Oligonukleotide besonders zur 
Isolation von Desaturasen geeignet sein k6nnen. 

35 Die Primer konnen in alien Kombinationen fiir Polymerase Ketten- 
reaktionen eingesetzt werden. Mithilfe einzelner Kombinationen 
konnten Desaturase-Fragmente isoliert, wenn nachfolgende 
Bedingungen berucksichtigt vmrden: Fiir PCR Reaktionen wurden 
jeweils 10 nMol Primer und 10 ng einer durch in vivo Excision 

40 gewonnenen Plasmidbank eingesetzt. Die Plasmidbank konnte nach 
Protokollen des Hers tellers (Stratagene) aus der Phagenbank 
isoliert werden. Die PCR-Reaktion wurde in einem Thermocycler 
(Biometra) mit der Pfu-DNA- Polymerase (Stratagene) xind dem 
folgenden Temperaturprogramm dxirchgef uhrt : 3 min bei 96^C, gefolgt 

45 von 35 Zyklen mit 30 s bei 96oC, 30 s bei 55<'C und 1 min bei 72«>C. 
Dabei wurde die Anlagerxingstemperatur nach dem ersten Schritt von 
55®C schrittweise urn je 3^C emiedrigt und nach dem ftinften Zyklus 
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eine AnlagerTongstemperatur • von 40^C beibehalten. Letztlich wurde 
ein Zyklus mit 10 min bei 12^C durchgefiihrt xind der Ansatz durch 
Kiihlen auf 4^0 beendet. 

5 Die Primerkombination F6a und R4a2 sind im Text unterstrichen 
gekennzeichnet \ind konnten erfolgreich zur Isolierung eines 
Desaturasefragmentes genutzt werden. Das resultierende Fragment 
konnte durch Sequenzieriing verifiziert werden und zeigte Homo- 
logien zu einer Desaturase mit der Genbank Accession Nr. T36617 

10 aus Streptomyces coelicolor. Die Homologie wurde mithilfe des 
BLASTP Programmes erhalten. Der Vergleich ist in Figur 4 dar- 
gestellt. Es ergaben sich IdentitSten von 34 % und eine Homo- 
logie von 43 % zu Sequenz T36617. Das DNA-Fragment wurde gemaS 
Beispiel 7 in einem Hybridisierungsexperiment zur Isolierung 

15 eines VollSngengens nach Standardbedingungen erfindungsgem&fi 
eingesetzt. 

Die Codierregion einer so isolierten DNA-Sequenz wurde durch 
Cbersetzung des genetischen Codes in eine Polypeptidsequenz 

20 erhalten. In SEQ ID NO: 3 ist eine 1434 Basenpaare lange 

Sequenz dargestellt, die durch beschriebenes Verfahren isoliert 
werden konnte. Die Sequenz besitzt ein Startcodon in Position 1 
bis 3 und ein Stopcodon in Position 1432-1434 und konnte in ein 
477 AminosSuren langes Polypeptid tibersetzt werden. Durch Ver- 

25 gleich mit einer in WO 98 46763 beschriebenen Gensequenz wurde 
gefunden, dass ein nicht identisches aber homologes Fragment 
aus Phaeodactylum tricornutiim codierend fiir 87 Aminosauren 
vorbeschrieben wurde. Jedoch offenbart WO 98/46763 weder eine 
vollstandige , funktionell aktive Desaturase noch Positions- 

30 Oder Substratspezif iSt . Dies wird auch dadurch deutlich, dass 
sowohl Homologien zur A-5, als auch zur A-6-Desaturase aus 
Mortierella alpina berichtet werden, ohne eine genaue Funktion 
festzulegen. Die erfindungsgemcLfie Sequenz hingegen codiert flir 
eine funktionell aktive A*6-Acyl Lipid Desaturase. 

35 

Beispiel 6: Identif izierxing von DNA Sequenzen codierend fiir 
Desaturasen aus Phaeodactylum tricornutum 

Die VolllSngensequenz der A-6-Acyl Lipid Desaturase Pp_des6 
4b AJ222980 (NCBI Genbank Accession Nr.) aus dem Moos Physco- 

mitrella patens (siehe auch Tabelle 1) sowie die A-12-acyl Lipid 
Desatiirase Sequenz (Tabelle 1 siehe Ma.desl2) aus Mortierella 
alpina AF110509 (AF110509 NCBI Genbank Accession Nr.) wurden 
ftir Sequenzvergleiche mithilfe des TBLASTN Suchalgorhythmus 
45 eingesetzt. 
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Die EST-Sequenz^n PT0010070010R, PT001072031R sowie PT001078032R 
wurden zunSchst aufgnand schwacher Homologien mit den Such- 
sequenzen aus Physcomitrella und Mbrtierella unter weiteren 
Kandidatengenen als Zielgen in Betracht gezogen. In Figiir 1 \ind 
5 in Figur 2 sowie Figur 2a ist das Ergebnis der zwei gefxmdenen 
est-Sequenzen dargestellt. Die gefundenen Sequenzen sind Teil 
der erfindungsgemSSen Nukleinscluren aus SEQ ID NO: 1 (Genname: 
Pt_des5, eigene Datenbank Nr. der Erfinder PT001078032R) , 
SEQ ID NO: 5. (Genname: Pt_desl2, eigene Datenbank NR. der 

10 Erfinder PT0010070010R) und SEQ ID NO: 11 (Genname: Pt„desl2.2, 
eigene Datenbank des Er finders PT001072031R) . Buchstaben zeigen 
identische Aminoscluren an, wahrend das Pluszeichen eine chemisch 
ahnliche Aminosaure bedeutet. Die Identitaten bzw. Homologien 
aller erf indungsgemaS gefundener Sequenzen gehen aus Tabelle 2 

15 zusammenf assend hervor, 

Desaturasen kormen CYtochrom b5 Domanen aufweisen, die auch in 
anderen nicht Desaturasen codierenden Genen vorkommen. Cytochrom 
b5 Domanen zeigen mi thin hohe Homologien an, obwohl es sich um 

20 verschiedene Genfunktionen handelt* Desatxirasen k5nnen schwach 
konservierter Bereiche lediglich als putative Kandidatengene 
identif iziert werden und mtissen auf die Enzymaktivitat und 
Positionsspezif itat der enzymatischen Funktion hin gepriift 
werden. Beispielsweise zeigen auch verschiedene Hydroxylasen, 

25 Acetylenasen tind Epoxygenasen Shnlich wie Desaturasen Histidin- 
Box Motive, so dass eine konkrete Funktion experimentell nach- 
gewiesen werden mu& und zusatzlich die Verif izieriing der Doppel- 
bindung erst eine sichere Enzymaktivitat und Positionsspezif itSt 
einer Desaturase ermoglicht. (iberraschenderweise wurde gefunden, 

30 dass erf indxingsgemafie A-6- und A-5- Desat\irase besonders geeig- 
nete Substratspezif itaten aufweisen und besonders geeignet sind, 
um in Kombination mit einer A-6-Elongase aus Physcomitrella zur 
Produktion von polyungesSttigten FettsSuren wie ArachidonsSure, 
Eicosapentaensaure und Docosahexaensaure genutzt werden konnen. 

35 

Die Sequenzier\ing des yollstandigen cDNA Fragmentes aus Klon • 
PT001078032R ergab eine 1652 Basenpaare lange Sequenz. Die 
Sequenz codiert fiir ein Polypeptid von 469 Aminos^uren dar- 
gestellt in SEQ ID NO: 2. Diese wurde erhalten durch Uber- 

40 setzung des genetischen Codes aus SEQ ID NO: 1 mit einem Start- 
codon in Basenpaarposition 115-117 und mit einem Stopcodon 
in Basenpaarposition 1522-1524. Der Klon beinhaltet ein voll- 
stclndiges Desaturase-Polypeptid, wie aus dem Sequenzvergleich 
in Figur 3 zu ersehen ist. Striche bedeuten identische Amino- 

45 scLuren wShrend Doppelpunkte \ind Einzelpunkte chemisch aus- 
tauschbare, d.h. chemisch Squivalente AiainosSuren darstellen. 
Der Vergleich wurde mit der BLOSUM62 Austauschmatrix ftlr Amino- 
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s^uren nach Henikoff & Henikoff durchgefiihrt : ( (1992) Amino acid 
substitution matrices from protein blocks. Proc, Natl. Acad.Sci. 
USA 89: 10915-10919). Verwendete Parameter: Gap Weight: 8; 
Average Match: 2.912, Length Weight: 2, Average Mismatch: -2.003. 

5 

In Figur 6 und Figur 7 ist der Vergleich der MA_desl2 Peptid- 
sequenz mit den gef\indenen Sec[uenzen dargestellt. 

Die Sequenzierung des vollstandigen cDNA Fragmentes aus Klon 
10 PT0010070010R ergab eine in SEQ ID NO: 5 dargestellte 1651 Basen- 
paare lange Sequenz mit einem Startcodon in Position 67-69 und 
einem Stopcodon in Position 1552-1554. Die erf indungsgemSSe Poly- 
petidsec[uenz ist in SEQ ID NO: 6 dargestellt. 

15 Die Sequenzierung des vollstandigen identifizierten cDNA 

Fragmentes aus Klon PT0010072031R ergab eine in SEQ ID NO: 11 
dargestellte 1526 Basenpaare lange Sequenz mit einem Startcodon 
in Position 92-94 und einem Stopcodon in Position 1400-1402. 
Die erfindungsgemaSe Polypetidsequenz ist in SEQ ID NO: 12 

20 dargestellt. 

In Tabelle 2 sind die Identitaten und Homologien erfindungs- 
gemSiSer Desaturasen \mtereinander und mit der Desaturase aus 
Physcomitrella patens und Mortierella alpina dargestellt. Die 

25 Angaben wurden mithilfe des Programms Bestfit unter gegebenen 
Parametern wie unten definiert als Teilprogramm folgender Soft- 
ware erhalten: Wisconsin Package Version 10.0 (Genetics Computer 
Group (GCG) , Madison, Wise, USA). Henikoff, S. and Henikoff , 
J.G. (1992). Amino acid substitution matrices from protein 

30 blocks. Proc. Natl. Acad. Sci. USA 89: 10915-10919. 

Weiterhin ist in Figur 5 der Vergleich der A-6-acyl Lipid 
Desaturase aus Physcomitrella patens mit der Polypeptidsequenz 
des Klons Pt_des6 dargestellt. 

35 

Tcibelle 2: 



Homologie / 


Suchsequenz 


Suchsequenz 


Identitat in % 


Pp_des6 


Ma_desl2 


Pt_des5 


34.92/26.37 


n.d. 


Pt_des6 


50.69/41.06 


n.d. 


Pt_desl2 


n.d. 


48.58/38.92 


Pt„desl2 . 2 


n.d. 


48.37/41.60 



n.d. = nicht durchgefCUirt 
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Mithilfe des Algorhythmus TBLASTN 2.0.10: Altschul et al 1997, 
* Gapped BLAST and PSI-BLAST: a new generation of protein database 
search programs". Nucleic Acids Res. 25:3389-3402 wurden Ober 
einen lokalen Datenbankvergleich Sequenzen mit hochster Sequenz- 
5 homologie bzw. Identitat identifiziert . Die Ergebnisse sind in 
folgender Tabelle 2A dargestellt. 

Tabelle 2A: Homologe mit den hochsten Sequenzhomologien bzw 

Identitaten zu erf indungsgemaSen Polypeptidsequenzen 



10 


aus SEQ ID NO. 


2, 4| 6 Oder 


12 






HOTiologie / 


Suchsequenz 


Suchsequenz 


Suchsequenz 


Suchsequenz 




Identitat (%) 


PT001070010R 


PT001072031R 


PT001078032R 


Pt_des6 


15 


L26296: Fad2 
A. thaliana 


50 % / 37 % 


n.d. 


n.d. 


n.d. 




U86072 Petro- 












selinum 


n.d. 


51/40 


n.d. 


n.d. 




crispum Fad2 












AL358652 










20 


li. major 
putative 
desaturase 


n.d. 


n.d. 


45/30 


n.d. 




AB020032 M. 












alpina delta 


n.d. 


n.d. 


n.d. 


53/38 


25 


6 desaturase 











Beispiel 7: Identif ikation von Genen mittels Hybridisierung 

Gensequenzen lassen sich zur Identif ikation homologer oder 
heterologer Gene aus cDNA- oder genomischen Banken verwenden. 

Homologe Gene (d.h. Voll-Langen-cDNA-Klone, die homolog sind, 
Oder Homologen) lassen sich tiber Nukleinsaurehybridisierung 
unter Verwendung von beispielsweise cDNA-Banken isolieren: Ins- 
besondere zur Isolierung von funktionell aktiven Voll-Langengenen 
der in SEQ ID NO: 3 gezeigten kann die Methode genutzt werden. 
Je nach der HSufigkeit des Gens von Interesse werden 100000 bis 
2U 1000000 rekombinante Bakteriophagen plattiert und auf eine 
Nylonmembran (iberfOhrt. Nach der Denaturierung mit Alkali wurde 
die DNA auf der Membran z.B. durch UV-Vemetz\ing immobilisiert . 
Die Hybridisierung erfolgt bei hoch-stringenten Bedingungen. In 
wSLssriger Ldsung werden die Hybridisierung und" die Waschschritte 
bei einer lonenstarke von 1 M NaCl und einer Temperatur von GB^'C 
durchgefOhrt. Hybridisierungssonden wurden z.B. durch Markierung 
mittels radioaktiver (32p-) Nicktranskription (High Prime, Roche, 
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Mannheim, Deutschland) hergestellt. Die Signale werden mittels 
Autoradiographie nachgewiesen . 

Partiell homologe oder heterologe Gene, die verwandt, aber nicht 
5 identisch sind, lassen sich analog zum oben beschriebenen Ver- 
fahren iinter Verwendiing niedrig-stringenter Hybridisierxmgs- und 
Waschbedingungen identifizieren. Ftir die wSssrige Hybridisierung 
wurde die lonenstarke gewohnlich bei 1 M NaCl gehalten, wobei 
die Temperatur nach und nach von 68 auf 42^C gesenkt wurde. 

10 

Die Isolierxing von Gensequenzen, die nur zu einer einzelnen 
DomSne von beispielsweise 10 bis 20 AminosSuren Homologien auf- 
weisen, ISsst sich unter Verwendung synthetischer , radioaktiv 
markierter Oligonukleotidsonden durchfuhren. Radioaktiv markierte 

15 Oligonukleotide werden mittels Phosphorylierung des 5'-Endes 

zweier komplementarer Oligonukleotide mit T4-Polynukleotidkinase 
hergestellt. Die komplementaren Oligonukleotide werden aneinander 
hybridisiert und ligiert, so dass Konkatemere entstehen. Die 
doppelstrangigen Konkatemere werden beispielsweise durch Nick- 

20 transkription radioaktiv markiert. Die Hybridisierung erfolgt 
gewdhnlich bei niedrig-stringenten Bedingungen unter Verwendung 
hoher Oligonukleotidkonzentrationen. 

Oligonukleotid-Hybridisierungsldsung: 

25 

6 X SSC 

0, 01 M Natriumphosphat 
1 mM EDTA (pH 8) 
0,5 % SDS 

30 100 mikrog/ml denaturierte Lachssperma-DNA 
0/1 % fettarme Trockenmilch 

Wahrend der Hybridisierung wird die Temperatur schrittweise auf 5 
bis 10**C xanter die berechnete Oligonukleotid-Tm oder bis auf Raum- 

35 temperatur (bedeutet RT = - 23°C in alien Experimenten, wenn nicht 
anders angegeben) gesenkt, gefolgt von Waschschritten und Auto- 
radiographie. Das Waschen wird mit extrem niedriger Stringenz 
durchgefiihrt, zum Beispiel 3 Waschschritte unter Verwendvmg von 
4 X SSC. Weitere Einzelheiten sind wie von Sambrook, J., et al. 

40 (1989), "Molecular Cloning: A Laboratory Manual", Cold Spring 
Harbor Laboratory Press, oder Ausubel, P.M., et al. (1994) 
"Current Protocols in Molecular Biology", John Wiley & Sons, 
beschrieben. 



45 
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Beispiel 8: Identifikation von Zielgenen durch Sichtimg von 
Expresslonsbanken mit Antik5rpern 

Es warden cDNA-Sequenzen zur Herstellung von rekombinantem 
5 Protein zuia Beispiel in E. coli verwendet (z.B. Qiagen QIAexpress 
pQE-System) . Die rekombinanten Proteine wurden dann gew6hnlich 
liber Ni-NTA-Af finitatschromatographie (Qiagen) affinitats- 
gereinigt. Die rekombinanten Proteine wurden dann zur Herstellung 
spezifischer Antik^rper beispielsweise unter Verwendung von 

10 Standardtechniken zur Immunisierung von Kaninchen verwendet. 
AnschlieSend wurden die Antik5rper dann unter Verwendung einer 
Ni~NTA-Saule, die mit rekombinantem Antigen vorgesSttigt wird, 
affinitatsgereinigt, wie von Gu et al., (1994) BioTechniques 
17:257-262 beschrieben. Der Antikorper kann dann zur Durch- 

15 musterung von Expressions-cDNA-Banken mittels imm\inologischem 
Sichtung verwendet werden (Sambrook, J., et al. (1989), 
"Molecular Cloning: A Laboratory Manual", Cold Spring Harbor 
Laboratory Press, oder Ausubel, P.M., et al. (1994) "Cxirrent 
Protocols in Molecular Biology", John Wiley & Sons) . 

20 

Beispiel 9 : Transformation von Agrobacterium 

Die Agrobacterium-venaittelte Pf lanzentransformation kann zum 
Beispiel unter Verwendung des GV3101- (pMP90-) (Koncz und Schell, 
25 Mol. Gen. Genet. 204 (1986) 383-396) oder LBA4404- (Clontech) 
Oder C58C1 pGV2260 (Deblaere et al 1984, Nucl. Acids Res. 13, 
4777-4788) Agrobacterium tumefaciens-Stamms durchgefiihrt werden. 
Die Transformation kann durch Standard-Transformationstechniken 
durchgefOhrt werden (ebenfalls Deblaere et al. 1984). 

30 

Beispiel 10: Pf lanzentransformation 

Die Agrobacterium-vermittelte Pf lanzentransformation kann unter 
Verwendung von Standard-Transformations- und Regenerations - 

35 techniken durchgefiihrt werden (Gelvin, Stanton B., Schilperoort , 
Robert A., Plant Molecular Biology Manual, 2. Aufl., Dordrecht: 
Kluwer Academic Publ., 1995, in Sect., Ringbuc Zentrale Signatur: 
BTll-P ISBN 0-7923-2731-4; Glick, Bernard R., Thompson, John E., 
Methods in Plant Molecular Biology and Biotechnology, Boca Raton: 

40 CRC Press, 1993, 360 S., ISBN 0-8493-5164-2). 

Beispielsweise kann Raps mittels Kotyledonen- oder Hypokotyl- 
transformation transformiert werden (Moloney et al., Plant 
Cell 8 (1989) 238-242; De Block et al.. Plant Physiol. 91 (1989) 
45 694-701) . Die Verwendung von Antibiotika fttr die Agrobacterium- 
\2nd Pf lanzenselektion' hSngt von dem f\ir die Transformation 
verwendeten binSren Vektor und Agrobacterium-Stamm ab. Die 
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Rapsselektion wird gewohnlich \mter Verwendung von Kanamycin 
als selektierbarem Pflanzenmarker durchgef tlhrt - 

Der AgrobacteriiJin-verTnittelte Gentransfer in Lein (Linum 
5 usitatissimum) ISsst sich xmter Verwendxing von beispielsweise 
einer von Mlynarova et al. (1994) Plant Cell Report 13:282-285 
beschriebenen Technlk durchfuhren. 

Die Transformation von Soja kann unter Verwendung von beispiels-- 
10 weise einer in EP-A-O 0424 047 {Pioneer Hi-Bred International) 
Oder in EP-A-0 0397 687, US 5,376,543, US 5,169,770 (University 
Toledo) beschriebenen Technik diirchgeftihrt werden. 

Die Pflanzentransf orraation \inter Verwendung von Teilchen- 
15 beschuss, Polyethylenglycol-ventiittelter DNA-Aufnahme oder 
tiber die Sillziumcarbonatfaser-Technik ist beispielsweise be- 
schrieben von Freeling und Walbot "The maize handbook'' (1993) 
ISBN 3-540-97826-7, Springer Verlag New York) . 

20 Beispiel 11: Plasmide fiir die Pflanzentransf ormation 

Geeignete bincLre Vektoren und Transformationsmarker 

Zur Pf lamzentransformation konnen binare Vektoren, wie pBinAR 

(Hofgen und Willmitzer, Plant Science 66 (1990) 221-230) oder 

25 pGPTV (Becker et al. 1992, Plant Mol. Biol. 20:1195-1197) verwen- 
det werden. Die Konstruktion der bin^ren Vektoren kann durch Li- 
gation der cDNA in Sense- oder Antisense-Orientierung in T- 
DNA erfolgen. 5' der cDNA aktiviert ein Pf lanzenpromotor die 
Transkription der cDNA, Eine Polyadenylier\ingssequenz befindet 

30 sich 3' von der cDNA. Die binaren Vektoren konnen unterschiedli- 
che Markergene tragen. So kann etwa die Resistenz durch die Ex- 
pression des nptll Markergens unter Kontrolle des 35S oder des 
nos Promoters erfolgen. Insbesondere kann das npt 1 1 -Marker gen co- 
dierend ftir Kanamycin-Resistenz vermittelt durch Neomycinphospho- 

35 transferase gegen die herbizidresistente Form eines Acetolactat 
Synthasegens (AHAS oder ALS) ausgetauscht werden. Das ALS-Gen ist 
beschrieben in Ott et al., J. Mol. Biol. 1996, 263:359-360. Geei- 
gnet fiir manche Pf lanzen ist auch die Verwendung des Hygromycin- 
Resistenz-Gens. Der v-ATPase-cl-Promotor kann in das Plasmid 

40 pBinl9 oder pGPTV kloniert werden und durch Klonierung vor die 
kodierende Region des ALS Gens ftlr die Markergenexpression ge- 
nutzt werden. Der genannte v-ATPase-c'l-Promotor entspricht einem 
1153 Basenpaar fragment aus Beta vulgaris (Plant Mol Biol, 1999, 
39:463-475). Der genannte nos Promoter Dabei kdnnen sowohl Sul- 

45 phonylhamstof fe als auch Imidazolinone wie Imazethapyr oder Sul- 
phonylharnstof fe als Antimetaboliten zur Selektion verwendet wer- 
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den. Alternativ kann auch der nos-Promoter ftir die Markergenex- 
pression verwendet werden. 

Beispiel 12: Ermittlung von geeigneten Promotoren fiir die 
5 Expression in Lein 

Die gewebespezifische Expression ISsst sich unter Verwendung ei- 
nes gewebespezif ischen Promoters erzielen. Beispielsweise kann 
die sainenspezif ische Expression erreicht werden, indem der DC3~ 

10 Oder der LeB4- oder der USP-Promotor oder der Phaseolin-Promotor 
5' der cDNA einkloniert wird. Auch jedes andere samenspezif ische 
Promotorelement wie z.B. der Napin- oder Arcelin Promoter (Goos- 
sens et al. 1999, Plant Phys. 120 (4) :1095-1103 und Gerhardt et 
al. 2000, Biochimica et Biophysica Acta 1490 (1-2) :87-98) kann 

15 verwendet werden. Zur konstitutiven Expression in der ganzen 
Pflanzen lasst sich der CaMV-35S-Promotor oder ein v-ATPase-cl • 
Promoter verwenden. 

Um die Eigenschaf ten des Promoters zu bestimmen und die essen- 
20 tiellen Elements desselben, die seine Gewebespezif itSt ausmachen, 
zu identifizieren, ist es erforderlich, den Promoter selbst oder 
verschiedene Fragmente desselben vor ein sogenanntes Reportergen 
zu setzen, das eine Bestimmung der Expressiensaktivitat ermog- 
licht. Beispielhaft fiir ein Reportergen sei die bakterielle 
25 fi-Glucuronidase (GUS) genannt (Jefferson et al., EMBO J. 1987, 6, 
3901-3907). Die S-Glucuronidase Aktivitat kann in-situ mittels 
eines chromogenen Substrates wie 5-Bromo-4-Chloro-3-Indolyl- 
fi-D-Glucuronsaure im Rahmen einer Aktivitatsfarbxing bestimmt wer- 
den (Jefferson, 1987, Plant Molecular Biology Reporter 5, 
30 387-405) • Fur die Untersuchungen der Gewebespezif it^t wird das 
pflanzliche Gewebe geschnitten, eingebettet, gefSrbt und analy- 
siert wie beschrieben (z.B. Baxamlein H et al., 1991 Mol Gen Genet 
225: 121-128). 

35 Fluorimetrischer GUS-Test (nach Montgomery et al., 1993) 

Dieser Assay erlaubt eine quantitative Bestimmung der GUS-Aktivi- 
tat in dem xmtersuchteti Gewebe. Ftlr die quantitative Aktivitats- 
bestimmung wird als Substrat fur die b-Glucuronidase MUG (4-Me- 
40 thyl-umbellif eryl-beta-D-glucuronid) verwendet, das in MU (Me- 
thyl -umbelliferon) xind Glucuronsfiure gespalten wird. 

Dabei wird zunSchst ein Proteinextrakt des gewOnschten Gewebe 
hergestellt, dem dann das Substrat der GUS zugesetzt wird. Das 
45 Substrat ist erst nach der Umsetzung durch GUS fluorimetrisch 
messbar. Zu verschiedenen Zeitpunkten werden Proben entnommen, 
die anschliefiend im Fluorimeter gemessen werden. Dieser Test 



wo 02/057464 



PCT/EP02/00461 



89 

wurde mit Leinembryonen verschiedener Altersstadien durchgefiihrt 
(21, 24 Oder 30 Tage nach Beginn der Bliite, daf = days after flo- 
wering) . Dazu wurde je ein Embryo in einem 2 itil-ReaktionsgefMS 
mit Hilfe einer Schwingmahle (Retsch MM 2000) in fltissigem Stick- 
5 stoff zu Pulver zerrieben. Nach Zugabe von 100 ml EGL- Puffer 
wurde fiir 10 min bei 25C und 14000 x g zentrifugiert . Der Uber- 
stand wurde abgenonunen und ein zweites Mai zentrifugiert. Wieder 
wurde der Uberstand in ein neues Reaktionsgefafi iiberfUhrt und bis 
zur weiteren Verwendiing auf Eis gehalten. Von diesem Proteinex- 

10 trakt wurden 25 ml mit 65 ml EGL-Puffer (ohne DTT) versetzt und 
ftlr den GUS-Assay eingesetzt. Nun wurden 10 ml des Substrates MUG 
(10 mM 4-Methyl-umbelliferyl-S-D-glucuronid) dazugegeben^ gevor- 
text und sofort 30 ml als Nullwert entnommen und mit 470 ml 
Stopp-Puffer (0,2 M Na2C03) versetzt. Dieser Vorgang wurde fiir 

15 alle Proben in einem Abstand von 30 s wiederholt. Die entnommenen 
Proben wurden bis zur Messimg im Ktlhlschrank gelagert. Weitere 
Messwerte wurden nach 1 h und nach 2 h entnommen- Fiir die Messung 
im Fluorimeter wurde eine Eichreihe erstellt, die Konzentrationen 
von 0,1 mM bis 10 mM MU (4-Methyl-umbellif eron) enthielt. Waren 

20 die Probenwerte auSerhalb dieser Konzentrationen, wurde weniger 
Proteinextrakt eingesetzt (10 ml, 1 ml, 1 ml aus 1:10 Verdiin- 
nung) , und es wurden kurzere Zeitabstande gemessen (Oh, 30 min, 
1 h) . Die MessTing erfolgte bei einer Exitation von 365 nm und ei- 
ner Emission von 445 nm in einem Fluoroscan II-GercLt (Labsystem) . 

25 Altemativ kann die Svibstratspaltung Unter alkalischen Bedingun- 
gen f luorometrisch verfolgt werden (Anregung bei 365 nm, Messung 
der Emission bei 455 nm; SpectroFluorimeter BMG Polarstar+) wie 
beschrieben in Bustos M.M. et al., 1989 Plant Cell 1:839-853. 
Alle Proben wurden einer Proteinkonzentrationsbestimmung nach 

30 Bradford (1976) unterzogen, um so eine Aussage iiber die Promote- 
raktivitat vmd -stSrke in verschiedenen Geweben und Pflanzen er- 
lauben. 



EGL-Puffer 

35 0,1 M KPO4, pH 7,8 

ImM EDTA 

5 % Glycerin 

1 M DTT 



40' Als weitere Beispiele fiir Reportergene , die aquivalent benutzt 
werden kSnnen, seien beispielhaft das griin f lucres zierende Pro- 
tein (GFP) und dessen Derivate genannt (C.Reichel et al. (1996) 
Proc. Natl. Acad. Sci. USA 93, 5888-5893 und J. Sheen et al., (1995) 
Plant Journal 8, 777-784) und verschiedene Luciferasen (A.Millar 

45 et al. (1992) Plant Mol. Biol. Reporter 10, 324-414). Die ent- 
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sprechenden Detektionsmethoden sind dem Fachmann bekannt und z.B. 
genaimter Literatur beschrieben. 

Beispiele f\ir Promoter-Reportergen-Konstrukte ftir oben genannte 
5 Promotoren sind iiti folgenden gegeben. Von diesen Promotoren kon- 
nen Fragmente mithilfe der Polymerasekettenreaktion isoliert und 
mit f lankierenden Sequenzen nach Wahl auf Basis von synthetischen 
Oligonukleotiden mafigeschneidert werden, 

10 Folgende Oligonukleotide kSnnen beispielsweise verwendet werden: 

LeB4 vorne: GAAAGCTTCTCGAGTTATGCATTTCTT 
LeB4 hinten: GGGTCTAGATCTGTGACTGTGATAG 
DC3a vorne: AGTGGATCCCCGAGCTAACCACAACT 
15 DC3a hinten: ATAAGCTTTTTCTTTGCAGA 

napinvorne : GAAAGCTTCTAATATGATAAACTCTG 
napinhinten: GGGTCTAGAAACACATACAAACATCAC 

Die Methoden sind dem Fachmann auf dem Gebiet bekannt xind sind 
20 allgemein literatur bekannt. 

In einem erst en Schritt werden die Promotorfragmente uber PGR am- 
plifiziert, mit geeigneten Restriktionsenzymen geschnitten \ind in 
die obigen Kassetten einkloniert. Beispielsweise wird das 

25 LeB4 (700)-PCR-Fraginent mit Xbal tind Hindlll geschnitten und in 
den Vektor pGPTV in die Hindlll und Xbal-Schnittstellen 5' vor 
dem GUS Reportergen kloniert. Das PCR-amplifizierte DC3-Promoter- 
fragment kann mit BamHI und Hindlll geschnitten/ z.B. in pBlues- 
cript (Stratagene)" subkloniert und dann in pGPTV in geeignete 

30 Schnittstellen vor das GUS-Reportergen kloniert werden. 

Beispielsweise kaim ein mit obigen Primem PCR-amplif iziertes na- 
pin~Promotorfragment mit einer Gro£e von 1055bp nach Verdau mit 
Hindlll und Xbal in pGPTV vor das GUS Reportergen einkloniert 
35 werden. Ein ^quivalentes Konstrukt konnte ein Napin-Promoter frag- 
ment von 110 Obp 5 '-kloniert vor ein GUS Reportergen mit Intron 
mit in 3' Richtung nachf olgendem Nos-Terminator in einem 
pHL9000-Vektor (Hausmaiin & TGpfer, 1999) sein. 

40 Unter Verwendung von oben beschriebenen oder Squivalenten Kon- 
strukten nach Transformation in Lein der Sorte Flanders, ISi&t 
sich die GUS-AktivitSLt in transgenen Leinembryonen verschiedener 
Altersstadien messen, die mit einem der folgenden Konstrxikte 
trans formiert wurden: Napin-GUS, 35S~GUS, LeB4-GUS, USP-GUS. Die 

45 Werte sind Mittelwerte aus ein bis ftinf Messungen mit verschiede- 
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nen Proteinmengen. Pro Konstinikt wurden je drei Embryonen quaint i- 
tativ analysiert. 

In der quantitativen Analyse ergaben sich groSe Unterschiede zwi- 
5 schen den verschiedenen samenspezifischen Promotoren. Der Napin 
Promotor aus Brassica napus erwies sich als um zwei bis drei 
Zehnerpotenzen weniger aktiv als die beiden Promotoren aus Vicia 
faba (LeB4 imd USP) . Die GUS-Aktivitat nahm in der Reihenfolge 
Napin, LeB4 und USP zu. Die Positivkontrolle 35S bewegte sich in 
10 ihrer AktivitSt zwischen LeB4 und USP, wohingegen die Negativkon- 
trolle, der nicht transfonaierte Wildtyp (Sorte Flanders), so gut 
wie keine Aktivitat besafi. Die folgende Tabelle gibt die Mittel- 
werte der Aktivitaten in den einzelnen Altersstadien sowie gesamt 
fur jedes Konstrukt wieder. 

15 

Tabelle 3.4: tJbersicht Ober die mittleren GUS-Aktivitaten von 
Leinembryonen, transformiert mit verschiedenen GUS-Konstrukten. 
daf : Tage nach Beginn der Blttte. 

20 Mit * markiert wurden Werte, die nur einer Messung zugrundelie- 
gen. 



25 



GUS- 


GUS-Aktivi- 


GUS-Aktivitat 


GUS-Aktivitat 


GUS-Aktivitat 


% vs. 


Konstrukt 


tat [nmol/ 


[nmol/h/mg Pro- 


[nmol/h/mg Pro- 


[nmol/h/mg Pro- 


358 




h/mg Protein] 


tein] 


tein] 


tein} 






Mittelwert 21 


Mittelwert 24 daf 


Mittelwert 30 daf 


Gesamtmittelwert 






daf 










Ohne 


0,06 


0,06 


*0.02 


0,05 


0,0007 


35S 


649,00 


913,00 


639,00 


734,00 


100,00 


Napin 


7,70 


•5,70 


3,70 


5,70 


0,80 


LeB4 


1778,00 


253,00 


283,00 


771,00 


105,00 


USP 


2843,00 


3770,00 


2107,00 


2907.00 


396,00 



35 



Beispiel 13: Plasmide fUr die Pflanzentrans formation 

Zur Pflanzentrans formation k6nnen binSre Vektoren, wie pBinAR 
(Hafgen und Willmitzer, Plant Science 66 (1990) 221-230) oder 
pGPTV (Becker et al 1992, Plant Mol. Biol. 20:1195-1197) oder 
Derivate davon verwendet werden. Die Konstriiktion der binaren 
Vektoren kann durch Ligation der cDNA in Sense- oder Antisense- 
Orientierung in T-DNA erfolgen. 5' der cDNA aktiviert ein 
Pflanzenpromotor die Transkription der cDNA, Eine Polyadenylie- 
rxmgssec[uenz befindet sich 3' von der cDNA. Die binSren Vektoren 
kfinnen unterschiedliche Markergene tragen. Insbesondere kann das 
nptll-Markergen codierend ftir Kanamycin-Resistenz vermittelt 
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durch Neomycinphosphotransf erase gegen die herbizidresistente 
Form eines Acetolactat Synthasegens (Ab)airz\xng : AHAS Oder ALS) 
ausgetauscht werden. Das ALS-Gen iat beschrieben in Ott et al., 
J. Mol. Biol. 1996, 263:359-360, Der v-ATPase-cl-Promotor kann in 
5 das Plasmid pBinl9 oder pGPTV kloniert werden und durch Klonie- 
rung vor das ALS Codierregion far die Markergenexpression genutzt 
werden. Der genannte Promotor entspricht einem 1153 Basenpaar- 
fragment aus beta-Vulgaris (Plant Mol Biol, 1999, 39:463-475). 
Dabei kSnnen sowohl Sulphonylhamstof fe als auch Imidazolinone 
10 wie Imazethapyr oder Sulphonylhamstof fe als Antimetaboliten zur 
Selektion verwendet werden. 

Die gewebespezifische Expression ISsst sich xinter Verwendung 
eines gewebespezif ischen Promoters erzielen. Beispielsweise kann 

15 die samenspezifische Expression erreicht werden, indent der DC3- 
oder der LeB4- oder der USP-Promotor oder der Phaseolin-Promotor 
5' der cDNA einkloniert wird. Auch jedes andere samenspezifische 
Promotorelement wie z.B. der Napin- oder Arcelin Promotor 
Goossens et al. 1999, Plant Phys. 120 (4) :1095-1103 und Gerhardt 

20 et al. 2000, Biochimica et Biophysica Acta 1490 (1-2) :87-98) kann 
verwendet werden. Zur konstitutiven Expression in der ganzen 
Pflanzen lasst sich der CaMV-35S-Promotor oder ein v-ATPase Cl 
Promotor verwenden. 

25 Insbesondere lassen sich Gene codierend f\ir Desaturasen und 
Elongasen durch Konstruktion mehrerer Expressionskassetten 
hintereinander in einen binaren Vektor klonieren, um den 
Stof fwechselweg in Pflanzen nachzubilden. 

30 Innerhalb einer Expressionskassette kann das zu exprimierende 
Protein unter Verwendung eines Signalpeptids, beispielsweise fOr 
Plastiden, Mitochondrien oder das Endoplasmatische Retikulum, in 
ein zellulares Kompartiment dirigiert werden (Kermode, Grit. Rev. 
Plant Sci- 15, 4 (1996) 285-423). Das Signalpeptid wird 5' im 

35 Leseraster mit der cDNA einkloniert, um die subzellulSre Lokali- 
siervmg des Fusionsprotein zu erreichen. 

Beispiele filz Multiexpfessionskassetten sind im folgenden 
gegeben • 

40 

I . ) Promotor-Terminator-Kassetten 

Expressionskassetten bestehen aus wenigstens zwei funktionellen 
Einheiten wie einem Promotor \md einem Terminator. Zwischen 
45 Promotor und Terminator k6nnen weitere gewOnschte Gensequenzen 
wie Targetting-Sequenzen, Codierregionen von Genen oder Teilen 
davon etc. eingefttgt werden. Zum Aufbau von Expressionskassetten 
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werden Promotoren und Terminatoren (USP Promo tor: Baeumlein 
et al., Mol Gen Genet, 1991, 225 (3):459-67); OCS Terminator: 
Gielen et al, EMBO J. 3 (1984) 835ff.) mithilfe der Polymerase- 
kettenreaktion isoliert vmd mit flankierenden Sequenzen nach Wahl 
5 auf Basis von synthetischen Oligonukleotiden maSgeschneidert. 

Folgende Oligonukleotide konnen beispielsweise verwendet werden: 
USPl vorne: CCGGAATTCGGCGCGCCGAGCTCCTCGAGCAAATTTACACATTGCCA 
USP2 vome: CCGGAATTCGGCGCGCCGAGCTCCTCGAGCAAATTTACACATTGCCA 
10 USP3 vorne: CCGGAATTCGGCGCGCCGAGCTCCTCGAGCAAATTTACACATTGCCA 
USPl hint en : AAAACTGCAGGCGGCCGCCCACCGCGGTGGGCTGGCTATGAAGAAATT 
USP2 hinten : CGCGGATCCGCTGGCTATGAAGAAATT 

USP3 hinten : TCCCCCGGGATCGATGCCGGCAGATCTGCTGGCTATGAAGAAATT 
OCSl vome: AAAACTGCAGTCTAGAAGGCCTCCTGCTTTAATGAGATAT . 
15 0CS2 vome: CGCGGATCCGATATCGGGCCCGCTAGCGTTAACCCTGCTTTAATGAGATAT 
GCS3 vorne: TCCCCCGGGCCATGGCCTGCTTTAATGAGATAT 

OCSl hinten: CCCAAGCTTGGCGCGCCGAGCTCGAATTCGTCGACGGACAATCAGTAAAOTGA 
0CS2 hinten: CCCAAGCTTCGCGCGCCGAGCTCGAATTCGTCGACGGACAATCAGTAAAT^ 
0CS3 hinten : CCCAAGCTTGGCGCGCCGAGCTC6TCGACGGACAATCAGTAAATTGA 

20 

Die Methoden sind dem Fachmann auf dem Gebiet bekannt iind sind 
allgemein literaturbekannt . 

In einem ersten Schritt werden ein Promotor und ein Terminator 
25 liber PGR amplif iziert . Dann wird der Terminator in ein Empfanger- 
plasmid kloniert und in einem zweiten Schritt der Promotor vor 
den Terminator inseriert. Mi thin erhalt man eine Expressions- 
kassette auf einem Tragerplasmid. Auf Basis des Plamides pUCl9 
werden die Plasmide pUTl, pUT2 und pUT3 erstellt. 

30 

Die Konstmkte sind erf indungsgemSE in SEQ ID NO: 13, 14 und 15 
definiert. Sie enthalten auf Basis von pUC19 den USP-Promotor \ind 
den OCS Terminator. Auf Basis dieser Plasmide wird das Konstrukt 
pUTl2 erstellt, indem pUTl mittels Sall/Scal geschnitten wird und 

35 pUT2 mittels Xhol/Scal geschnitten wird. Die die Expressions- 
kassetten enthaltenden Fragmente werden ligiert und in E, coli 
XLI blue MRF transf ormiert . Es wird nach Vereinzelung ampicillin- 
resistenter Kolonien DNA prSpariert und per Restriktionsanalyse 
solche Klone ident if iziert, die zwei Expressionskassetten ent- 

40 halt en. Die Xhol/Sall Ligation kompatibler Enden hat dabei die 
beiden Schnittstellen Xhol und Sail zwischen den Expressions- 
kassetten eliminiert. Es resultiert das Plasmid pUT12, das in 
SEQ ID NO: 16 definiert ist. Anschliefiend wird pOTl2 wiederum 
mittels Sal/Scal geschnitten \md pUT3 mittels XhoI/Scal ge- 

45 schnitten. Die die Expressionskassetten enthaltenden Fragmente 
werden ligiert und in'E, coli XLI blue MRF transf ormiert. Es wird 
nach Vereinzelung ampicillinresistenter Kolonien DNA prSpariert 



wo 02/057464 



PCT/EP02/00461 



94 

imd per Restriktionsanalyse solche Klone identif iziert, die drei 
Expressionskassetten enthalten. Auf diese Weise wird ein Set von 
Multiexpressionskassetten geschaffen, dass fxir die Insertion ge- 
wiinschter DNA genutzt werden kann \ind in Tabelle 3 beschrieben 
5 wird \md zudem noch weitere Expressionskassetten aufnehmen kann, 

Diese enthalten folgende Elemente: 

Tabelle 3 



20 



pUC19- 
Derivat 


Schnittstellen vor dem 
USP Promotor 


Multiple 
Klonienings-Schnittstellen 


Schnittstellen hinter dem 
OCS-Tenninator 


pUTl 


EcoRI/AscI/ Sacl/Xhol 


BstXI/NotI/ Pstmal/StuI 


Sall/EcoRI/ SacI/AscI/ 
Hindm 


pUT2 


EcoRI/AscI/ Sacl/Xhol 


BamHI/EcoRV/ Apal/Nhel/ Hpal 


Sall/EcoRI/SacI/Ascy 
Hindm 


pUT3 


EcoRI/AscI/SacI/XhoI 


Bgin/Naey Clal/Smal/Ncol 


Sall/SacyAscI/Hindm 


pUT12 

Doppel-expres- 
sionskassette 


EcoRI/AscI/ SacVXhol 


BstXI/NotI/ Pstl/Xbal/StuI 
Und 

BamHI/EcoRV/ Apal/Nhel/ Hpal 


Sall/EcoRI/ SacI/AscI/ 
Hindm 


pUT123 

Tripel-expres- 

sioQskassette 


EcoRI/AscI/ Sacl/Xhol 


l£stXI/NotI/ Pstl/Xbal/StuI 
und 

2 JBamHI/EcoRV/ Apal/Nhel/ 

Hpal 

und 

3.BglII/NaeI/ Clal/Smal/NcoI 


Sall/Sacl/Ascl/Hindm 



25 



Weiterhin lassen sich wie beschrieben und wie in Tabelle 4 nSher 
spezifiziert weitere Multiexpressionskassetten mithilfe des 

30 i) USP-Promotors oder mithilfe des 

ii) ca. 700 Basenpaare 3 ' -Fragmentes des LeB4-Proiaotors oder 

mithilfe des 

iii) DC3-Promotors erzeugen und fiir samenspezif ische Genexpression 
einsetzen. 

35 

Der DC3-Promotor ist beschrieben bei Thomas, Plant Cell 1996, 
263:359-368 und besteht lediglich aus der Region -117 bis +27 
weshalb er mithin einer der kleinsten bekannten samenspezif ischen 
Promotoren darstellt. 

40 

Von diesen Promotoren konnen Fragmente mithilfe der Polymerase- 
kettenreaktion isoliert und mit flankierenden Seqiienzen nach Wahl 
auf Basis von synthetischen Oligonukleotiden mafigeschneidert wer- 
den. 

45 

Folgende Oligonukleotide kdnnen beispielsweise verwendet werden: 
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LeB4 vorne: 
LeB4 hinten: 
DC3a vorne: 
DC3a hinten: 



GAAAGCTTCTCGAGTTATGCATTTCTT 
GGGTCTAGATCTGTGACTGTGATAG 
CCGGAATTCGGCGCGCCGAGCTCCTCGAG 
CGCGGATCCTAGCTTTTTCTTGGCAGATG 



5 



Die Methoden sind dem Fachmaim auf dem Gebiet bekannt und sind 
allgemein literaturbekannt . 

In einem erst en Schritt werden die Promoter fragmente aber PGR am- 
10 plifiziert, mit geeigneten Restriktionsenzyinen geschnitten und in 
die obigen Kassetten einkloniert. Beispielsweise wird das 
LeB4(700)-PCR-Fraginent mit Xhol und Bglll geschnitten und in die 
Xhol und Bglll-Schnittstellen des Plasmids pUT3 eingesetzt, um 
pLT3 zu erhalten. 



Vorteilhafte Expressionskassetten enthalten auf Basis von pUC19 
(Vieira und Messing (1982); Gene 19, 259), die SEQ ID NO: 32, den 
LeB4-Promotor und die Sequenzen SEQ ID NO: 33, SEQ ID NO: 34 oder 
SEQ ID NO: 35. Auf Basis dieser Plasmide wird das Konstrukt pLTl2 

20 erstellt, indem pUTl mittels Sall/Scal geschnitten wird und pUT2 
mittels Xhol/Scal geschnitten wird. Die die Expressionskassetten 
enthaltenden Fragmente werden ligiert und in E, coli XLI blue MRF 
transformiert . Es wird nach Vereinzelimg Ampicillin-resistenter 
Kolonien DNA prapariert und per Restriktionsanalyse seiche Klone 

25 identif iziert, die zwei Expressionskassetten enthalten. Die Xhol/ 
Sail Ligation kompatibler Enden hat dabei die beiden Schnittstel- 
len Xhol und Sail zwischen den Expressionskassetten eliminiert. 
Es resultiert das Plasmid pUTl2, das in SEQ ID NO: 16 definiert 
ist. AnschlieSend wird pUT12 wiederum mittels Sal/Scal geschnit- 

30 ten und pUT3 mittels XhoI/Scal geschnitten. Die die Expressions- 
kassetten enthaltenden Fragmente werden ligiert und in E. coli 
XLI blue MRF transformiert. Es wird nach Vereinzelung Ampicillin- 
resistenter Kolonien DNA prSpariert und per Restriktionsanalyse 
solche Klone identif iziert , die drei Expressionskassetten enthal- 

35 ten. Auf diese Weise wird eine Auswahl von Multiesqpressionskas- 
setten geschaffen, die filr die Insertion gewOnschter DNA genutzt 
werden kann und in Tabelle 3 beschrieben wird und zudem noch wei- 
tere Expressionskassetten aufnehmen kann. 

40 Die Expressionskassetten k5nnen mehrfach den selben Promoter ent- 
halten Oder aber tiber drei verschiedene Promotoren aufgebaut wer- 
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den. 
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Tabelle 4: Multiple Expressionskassetten 





Plasmidname des 
pUC19-Dcrivates 


Schnittstellen vor dem 
jeweiligen Promotor 


Multiple 
Kionienings-Schnittstellen 


Schnittstellen hinter 
dem OCS-Tenninator 


5 


pUTl 

(pUC19mit 
USP-OCSl) 


EcoRI/AscI/SacI/XhoI 


(1) BstXI/Notl/Psfl/Xbal/StuI 


Sall/EcoRI/SacI/AscI/ 
Hindm 




pDCT ' 

(pUC19mit 

DC3-OCS) 


EcoRI/AscI/SacI/XhoI 


(2) BamHI/EcoRV/ Apal/Nnel/ 
Hpal 


oalJ/ JbcoxvJ/oaci/ASCi/ 
Hindm 


10 


pLeBT 

(pUC19-rait 

LeB4(700}-OCS) 


EcoRI/AscI/SacI/XhoI 


(3) BgUI/Nael/ Clal/Smaimcol 


Sall/Sacl/Ascl/Hindm 


15 


pUD12 

(pUC 19mitmit 
USP-OCSl und mit 
DC3-0CS) 


EcoRI/AscI/SacI/XhoI 


(1) BstXI/Notl/Pstl/Xbal/StuI 
und 

(2) BamHI/EcoRV/ Apal/Nhel/ 
Hpal 


Sall/EcoRI/SacyAscI/ 
Hindm 




pUDL123 
Triple expression 




(1) BstXI/NotI/ Pstl/Xbal/StuI 
und 


Sall/Sacl/Ascl/Hindin 


20 


cassette 

(pUC19mitUSP/ 

DC3und 

LeB4-700) 


EcdRI/AscVSacJ/Xhol 


(2) BamHI/ (EcoRV*)/ApaI/ 
Nhel/Hpalund 

(3) Bgin/Nael/ Clal/Smal/Ncol 





* EcoRV Schnittstelie schneidet im 700 Basenpaar fragment des LeB4 
Promoters (LeB4~700) 

25 

Analog lassen sich weitere Promotoren fttr Multigenkonstrukte 
erzeugen insbesondere unter Verwendung des 

a) 2,4 kB Fragmenties des LeB4-Promotors (Baumlein et al., 1991: 
20 Mol. Gen. Genet. 225,121-128) oder mithilfe des 

b) Phaseolin-Promotors (Bustos et al. (1989) Plant Cell 
1,839-853) Oder mithilfe des 

2^ c) konstitutiven v-ATPase cl-Promotors . 

Es kann insbesondere wiinschenswert sein, weitere besonders geei- 
gnete Promotoren zum Aufbau samenspezif ischer Multiexpressions- 
kassetten wie z.B. eines der Fragmente des Napin- Promoters (Stal- 
*0 berg et al., 1993: Plant Mol, Biol. 23, 671-683) oder den Arcelin-5 
Promotor (A.Goossens et al.', 1999: plant Physiol. 120,1095-1104) 
zu verwenden. 



45 
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ii) Erstellung von Expressionskonstrukten in pUClS- oder pGPTV 
Derivaten, die Promotor und Terminator erhalten und in 
Kombination mit gewiinschten Gensequenzen ziir PUFA Gen- 
expression in pflcuizlichen Expressionskassetten enthalten, 

5 

Multiexpressionskassetten konnen mittels AscI direkt von 
pUC19-Derivaten aus Tabelle 3 in den Vektor pGPTV+AscI (siehe 
iii.)) aber die AscI Schnittstelle inseriert werden und stehen 
zur Inserierung von Zielgenen zur VerfCigiing. Die entsprechenden 

10 Genkonstrukte (pBUTl ist in SEQUENZ ID NO: 20, pBUT2 ist in 
SEQUENZ ID NO: 21, pBUT 3 ist in SEQUENZ ID NO: 22, pBUTl2 
ist in SEQUENZ ID NO: 22 und pBUT123 ist in SEQUENZ ID NO: 24 
dargestellt) stehen erfindunsgemSS als Kit zur Verfiigung. 
Altemativ kOnnen Gensequenzen in die pUC19 basierten 

15 Expressionskassetten inseriert werden und als AscI Fragment 
in pGPTV+AscI eingesetzt werden. 

In pUT12 wird zunachst uber BstXI und Xbal die D-6-Elongase 
Pp_PSEl in die erste Kassette inseriert. Dann wird die 

20 D-6-Desaturase aus Moos (Pp_des6) aber BamHI/Nael in die 

zweite Kassette inseriert. Es entsteht das Konstrukt pUT-ED.Das 
AscI Fragment aus dem Plasmid pUT-ED wird in den mit AscI ge- 
schnittenen Vektor pGPTV+AscI inseriert und die Orientierung des 
inserierten Fragmentes mittels Restriktion oder Sequenzierung 

25 ermittelt. Es entsteht das Plasmid pB-DHGLA, dessen vollst&idige 
Sequenz in SEQUENZ ID NO. 25 dargestellt ist. Die Codierregion 
der Physcomitrella delta 6 Elongase ist in SEQUENZ ID NO. 26 
dargestellt, die der delta 6 Desat\irase aus Physcomitrella in 
SEQUENZ ID NO: 27. 

30 

In pUTl23 wird zunachst Ober BstXI und Xbal die A-6-Elongase 
Pp_PSEl in die erste Kassette inseriert. Dann wird die 
A-6-Desaturase aus Moos (Pp_des6) liber BamHI/Nael in die 
zweite Kassette inseriert und schliel^lich die A-5-Desaturase 
35 aus Phaeodactylum (Pt_des5) \iber Bglll in die dritte Kassette 
inseriert. Das Dreifachkonstrukt erhait den Namen pARAl. Unter 
BertLcksichtigung sequenzspezif ischer Restriktionsschnittstellen 
k5nnen weitere Expressionskassetten gemafi Tabelle 5 mit der 
Bezeichnving pARA2, pARA3 xind pARA4 erstellt werden. 

40 

Das AscI Fragment aus dem Plasmid pARAl wird in den mit AscI 
geschnittenen Vektor pGPTV+AscI inseriert xind die Orientierung 
des inserierten Fragmentes mittels Restriktion oder Sequenzierxmg 
ermittelt. Die vollstandige Sequenz des resultierenden Plasmides 
45 pBARAl ist in SEQUENZ ID NO. 28 dargestellt. Die Codierregion 
der Physcomitrella delta 6 Elongase. ist in SEQUENZ ID NO. 29 
dcurgestellt, die der delta 6 Desaturase aus Physcomitrella 
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in SEQUENZ ID NO: 30 xind die der delta-5 Desaturase aus 
Phaeodactylxim tricomutum in SEQUENZ ID NO: 31, 



Tabelle 5: Kombinationen von Desaturasen und Elongasen 



5 





Gen 
Plasmid 


A-6-Desaturase 


A-S-Desaturase 


A-6-Elongase 


1 


PUT-ED 


Pp_des6 




PpJ'SEl 


2 


pAEAl 


PL.des6 


PUlesS 


PpJPSEl 


3 


pARA2 


PLdes6 


Ce_des5 


PpJPSEl 


4 


pARA3 


PL.des6 


Cc_des5 


PpJ^SEl 


5 


pARA4 


Ce_des6 


Ce_des5 


CeJ»SEl 


6 


PBDHGLA 


PLdes6 




PpJPSEl 


7 


PBARAI 


Pt_des6 


PUiesS 


PpJPSEl 



Plasmide 1 bis 5 sind pUC Derivate, Plasmide 6 bis 7 sind binare 
P f 1 anz en t r ans format ions vek t or en 



20 



25 



Pp = Physcomitrella patens, Pt = Phaeodactylum tricomutum 
Pp_PSEl entspricht der Sequenz aus SEQ ID NO: 9. 
PSE = PUFA spezifische A-6-Elongase 

Ce_des5 = A- 5 -Desaturase aus Caenorhabditis elegans (Genbank Acc . 
Nr. AF078796) 

Ce_des6 = A-6-Desaturase aus Caenorhabditis elegans elegans 
(Genbank Acc. Nr. AF031477, Basen 11-1342) 

Ce_PSEl = A-6-Elongase aus Caenorhabditis elegans (Genbank Acc. 
Nr. AF244356, Basen 1-867) 



Auch weitere Desaturasen oder Elongasegensequenzen kdnnen in 
Expressionskassetten beschriebener Art inseriert werden wie 
z.B. Genbank Acc. Nr. AF231981, NM_013402, AF206662, AF268031, 
AF226273, AFllOSlO oder AF110509. 

iii)Trcinsfer von Expressionskassetten in Vektoren zur 

Transformation von Agrobakterium tumefaciens und zur 
Transformation von Pflanzen 

Chimare Genkonstrukte auf Basis der in pUC19 beschriebenen konnen 
mittels AscI in den bin^ren Vektor pGPTV inseriert. Die multiple 
Klonieriingssequenz wird zu diesem Zweck um eine AscI Schnitt- 
stelle erweitert. Zu diesem Zweck wird der Polylinker als zwei 
doppelstrSngige Oligonukleotide neu synthetisiert , wobei eine zu- 
satzliche AscI DNA Sequenz eingefUgt wird. Das Oligonukleotid 
wird mittels EcoRI und Hindlll in den Vektor pGPTV inseriert. Es 
entsteht das Plasmid pGPTV+AscI. Die notwendigen Kloniertechniken 
sind dem Fachmann bekannt und kdnnen einfach wie in Beispiel 1 
beschrieben nachgelesen werden. 
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Beispiel 14: In vivo-Mutagenese 

Die in vivo-Mutagenese von Mikroorganisinen kann mittels Passage 
der Plasmid- (oder einer anderen Vektor-) DNA durch E. coli 
5 Oder andere Mikroorganismen (z.B. Bacillus spp. oder Hefen, 
wie Saccharomyces cerevisiae) , bei denen die Fahigkeiten, die 
Unversehrtheit ihrer genetischen Information aufrechtzuerhalten, 
gestart ist, erfolgen. Obliche Mutator-StSmme haben Mutationen in 
den Genen f<ir das DNA-Reparatur system (z.B. mutHLS, mutD, mutT 

10 usw.; als Literaturstelle siehe Rupp, W,D. (1996) DNA repair 
mechcLnisms , in: Escherichia coli and Salmonella, S. 2277-2294, 
ASM: Washington) . Diese StSmme sind dem Fachmann bekaimt. Die 
Verwendung dieser StSmme ist beispielsweise in Greener, A. , und 
Callahan, M. (1994) Strategies 7:32-34, erlautert. Der Transfer 

15 mutierter DNA-Molekiile in Pflemzen erfolgt vorzugsweise nach 

Selektion und Test der Mikrooganismen. Transgene Pflanzen werden 
nach verschiedenen Beispielen im Beispielteil dieses Dokumentes 
erzeugt, 

20 Beispiel 15: Untersuchung der Expression eines rekombinanten 
Genproduktes in einem trans formier ten Organismus 

Die Aktivitat eines rekombinanten Genproduktes im transf ormierten 
Wirtsorganismus kann auf der Transkriptions- und/oder der 
25 Translationsebene gemessen werden. 

Ein geeignetes Verfahren zur Bestimmung der Menge an 
Transkription des Gens (ein Hinweis auf die Menge an RNA, 
die fur die Translation des Genproduktes zur Verfiigung steht) 

30 ist die Durchftihrung eines Northern-Blots wie \inten ausgeftthrt 
(als Bezugsstelle siehe Ausubel et al. (1988) Current Protocols 
in Molecular Biology, Wiley: New York, oder den oben erwahnten 
Beispielteil), wobei ein Primer, der so gestaltet ist, dass 
er an das Gen von Interesse bindet, mit einer nachweisbaren 

35 Markierung (gewGhnlich radioaktiv oder chemilumineszent) markiert 
wird, so dass, wenn die Gesamt-RNA einer Kultur des Organismus 
extrahiert, auf einem Gel aufgetrennt, auf eine stabile Matrix 
treinsferiert und mit dieser Sonde inkubiert wird, die Bindung und 
das AusmaS der Bindung der Sonde das Vorliegen ^md auch die Menge 

40 der mRNA fiir dieses Gen anzeigt. Diese Information zeigt den 
Grad der Transkription des 'trans formier ten Gens an. ZellulSre 
Gesamt-RNA kann aus Zellen, Geweben oder Organen mit mehreren 
Verfahren, die alle im Fachgebiet bekannt sind, wie zum Beispiel 
das von Borraann, E.R., et al. (1992) Mol. Microbiol. 6:317-326 

45 beschriebene, prSpariert werden. 
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Northem-Hybridisierung 

Fiir die RNA-Hybridisierung warden 20 |ig Gesamt-RNA oder 1 (xg 
poly(A)+-RNA mittels Gelelektrophorese in Agarosegelen mit 
5 einer Starke von 1,25 % \inter Verwendung von Formaldehyd, wie 
beschrieben in Amasino {1986, Anal. Biochem. 152, 304) auf- 
getrennt, mittels Kapillaranziehiing iinter Verwendting von 10 x 
SSC auf positiv geladene Nylonmembranen (Hybond N+, Amersham, 
Braunschweig) Obertragen, mittels UV-Licht immobilisiert und 

10 3 Stunden bei 68°C \inter Verwendung von Hybridisierungspuf f er 

(10 % Dextransulfat Gew./Vol., 1 M NaCl, 1 % SDS, 100 mg Herings- 
sperma-DNA) vorhybridisiert . Die Markierxmg der DNA-Sonde mit 
dem Highprime DNA labeling-Kit (Roche, Mannheim, Deutschland) 
erfolgte wahrend der Vorhybridisierung unter Verwendung von 

15 alpha-32p-ciCTP (Amersham, Braunschweig, Deutschland) . Die Hybridi- 
sierung wurde nach Zugabe der markierten DNA-Sonde im gleichen 
Puffer bei 68**C Ober Nacht durchgef tihrt - Die Waschschritte wurden 
zweimal fiir 15 min unter Verwendung von 2 X SSC \md zweimal fiir 
30 min unter Verwendung von 1 X SSC, 1 % SDS, bei 68° C durch- 

20 geftihrt. Die Exposition der verschlossenen Filter wurde bei -70®C 
ftlr einen Zeitraum von 1 bis 14 T durchgef Uhrt . 

Zur Untersuchung des Vorliegens oder der relativen Menge an von 
dieser mRNA trans latier tern Protein konnen Standardtechniken, wie 

25 ein Western-Blot, eingesetzt werden (siehe beispielsweise Ausubel 
et al. (1988) Current Protocols in Molecular Biology, Wiley: 
New York) . Bei diesem Verfahren werden die zellulciren Gesamt- 
Proteine extrcdiiert, mittels Gelelektrophorese aufgetrennt, 
auf eine Matrix, wie Nitrozellulose, iabertragen und mit einer 

30 Sonde, wie einem TVntikOrper, der spezifisch an das gewOnschte 
Protein bindet, inkubiert. Diese Sonde ist gewohnlich mit einer 
chemilumineszenten oder kolorimetrischen Markierung versehen, 
die sich leicht nachweisen ISsst. Das Vorliegen und die Menge 
der beobachteten Markierung zeigt das Vorliegen und die Menge des 

35 gewiinschten, in der Zelle vorliegenden mutierten Proteins an. 

Beispiel 16: Analyse der Auswirkung der rekombinanten Proteine 
auf die Produktion des gewiinschten Produktes 

40 Die Auswirkung der genetischen Modifikation in Pflanzen, Pilzen, 
Algen, Ciliaten oder auf die Produktion einer gewiinschten- Ver- 
bindung (wie einer Fettsaure) kann bestimmt werden, indem die 
modifizierten Mikroorganismen oder die modifizierte Pflanze 
\mter geeigneten Bedingungen (wie den vorstehend beschriebenen) 

45 geziichtet werden und das Medim und/oder die zellulciren Kompo- 
nenten auf die erh6hte Produktion des gewiinschten Produktes (d.h. 
von Lipiden oder einer FettsSure) untersucht wird. Diese Analyse- 
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techniken sind dem Fachmann bekannt und ximfassen Spektroskopie, 
Diinnschichtcliromatographie, Farbeverfahren verschiedener Art, 
enzymatische xmd mikrobiologische Verfahren sowie analytische 
Chromatographies wie Hochleistxmgs-Flussigkeitschromatographie 
5 (siehe beispielsweise Ullman, Encyclopedia of Industrial 

Chemistry, Bd. A2, S. 89-90 und S. 443-613, VCH; Weinheiiti (1985); 
Fallon, A., et al., (1987) ''Applications of HPLC in Biochemistry" 
in: Laboratory Techniques in Biochemistry and Molecular Biology, 
Bd. 17; Rehm et al. (1993) Biotechnology, Bd. 3, Kapitel III: 

10 ''Product recovery and purification", S. 469-714, VCH: Weinheim; 
Belter, P. A., et al. (1988) Bioseparations : downstream processing 
for Biotechnology, John Wiley and Sons; Kennedy, J. P., und 
Cabral, J.M.S. (1992) Recovery processes for biological Materi- 
als, John Wiley and Sons; Shaeiwitz, J. A., und Henry, J.D. (1988) 

15 Biochemical Separations, in: Ullmann's Encyclopedia of Industrial 
Chemistry, Bd. B3; Kapitel 11, S. 1-27, VCH: Weinheim; und 
Dechow, F.J. (1989) Separation and purification techniques in 
biotechnology, Noyes Pxiblications) . 

20 Neben den oben erwShnten Verfahren werden Pf Icinzenlipide aus 
Pflanzenmaterial wie von Cahoon et al. (1999) Proc. Natl. Acad. 
Sci. USA 96 (22) :12935-12940, und Browse et al. (1986) Analytic 
Biochemistry 152:141-145, beschrieben extrahiert. Die qualitative 
und quantitative Lipid- oder Fettsaureanalyse ist beschrieben 

25 bei Christie, William W. , Advances in Lipid Methodology, Ayr/ 
Scotland: Oily Press (Oily Press Lipid Library; 2); Christie, 
William W. , Gas Chromatography and Lipids. A Practical Guide 
- Ayr, Scotland: Oily Press, 1989, Repr. 1992, IX, 307 S. (Oily 
Press Lipid Library; 1) ; "Progress in Lipid Research, Oxford: 

30 Pergamon Press, 1 (1952) - 16 (1977) u.d.T. : Progress in the 
Chemistry of Fats and Other Lipids CODEDEJ. 

ZusS.tzlich zur Messung des Endproduktes der Fermentation ist 

es auch m5glich, andere Komponenten der Stof fwechselwege zu ana- 

35 lysieren, die zur Produktion der gewiinschten Verbindung verwendet 
werden, wie Zwischen- und Nebenprodukte , uiti die Gesamtef f izienz 
der Produktion der Verbindiing zu bestiininen. Die Analyseverfahren 
\amfassen Messoingen der NShrstof fmengen im Medium (z.B. Zucker, 
Kohlenwasserstoffe, Stickstof fquellen, Phosphat und andere 

40 lonen) , Messungen der Biomassezusammensetzung und des Wachstums, 
Analyse der Produktion \iblicher Metabolite von Biosynthesewegen 
und Messxingen von Gasen, die wahrend der Fermentation erzeugt 
werden. Standardverfahren fOr diese Messungen sind in Applied 
Microbial Physiology; A Practical Approach, P.M. Rhodes und P.F. 

45 Stanbury, Hrsgb., IRL Press, S. 103-129; 131-163 und 165-192 
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(ISBN: 0199635773) und darin angegebenen Literaturstellen 
beschrieben. 

Ein Beispiel ist die Analyse von FettsSuren (Abktirziingen: FAME, 
5 Fettsauremethylester; GC-MS, Gas-Fliissigkeitschromatographie- 
Massenspektrometrie; TAG, Triacylglycerin; TLC, Dxinnschicht- 
chromatographie) . 

Der unzweideutige Nachweis fiir das Vorliegen von Fettsaure- 
10 produkten kann mittels Analyse rekombinanter Organismen nach 
Standard-Analyseverfahren erhalten werden: GC, GC-MS oder TLC, 
wie verschiedentlich beschrieben von Christie und den Literatxir- 
stellen darin (1997, in: Advances on Lipid Methodology, Vierte 
Aufl.: Christie, Oily Press, Diindee, 119-169; 1998, Gaschromato- 
15 graphie-Massenspektrometrie-Verfahren, Lipide 33:343-353). 

Das zu analysierende Material kann durch Ultraschallbehandlung, 
Mahlen in der Glasmiihle, flUssigen Stickstoff und Mahlen oder 
viber andere anwendbare Verfahren aufgebrochen werden. Das 

20 Material muss nach dem Aufbrechen zentrifugiert werden. Das 
Sediment wird in Aqua dest. resuspendiert, 10 min bei lOO^'C 
erhitzt, auf Eis abgekiihlt und emeut zentrifugiert, gefolgt 
von Extraktion in 0,5 M Schwef elsaure in Methanol mit 2 % 
Dimethoxypropan fiir 1 Std, bei 90*C, was zu hydrolysierten Ol- 

25 und Lipidverbindxmgen ftthrt, die transmethylierte Lipide ergeben. 
Diese Fettsauremethylester werden in Petrolether extrahiert und 
schlieSlich einer GC-Analyse unter Verwendung einer Kapillarsaule 
(Chrompack, WCOT Fused Silica, CP-Wax-52 CB, 25 mikrom, 0,32 mm) 
bei einem Temperaturgradienten zwischen 170°C tand 240°C fiir 20 min 

30 \md 5 min bei 240**C unterworfen. Die IdentitSt der erhaltenen 
Fettsauremethylester muss unter Verwendiing von Standards, die 
aus koiranerziellen Quellen erhSltlich sind (d.h. Sigma), definiert 
werden . 

35 Bei Fettscluren, fiir die keine Standards verfiigbar sind, muss die 
Identitat tiber Derivatisierung und cinschliefiende GC-MS-Analyse 
gezeigt werden. Beispielsweise muss die Lokalisierung von Fett- 
sauren mit Dreifachbindung tiber GC-MS nach Derivatisierung mit 
4 , 4-Dimethoxyoxazolin-Derivaten (Christie^ 1998, siehe oben) 

40 gezeigt werden. 
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E3<pressionskonstrukte in heterologen mikrobiellen Systemen 

StSmme, Wachstxunsbedingungen und Plasmide 

5 Der Escherichia coli-Stamm XLl Blue MRF' kan (Stratagene) wurde 
zur Siibkloniemng der neuen Desaturase pPDesaturasel aus Physco- 
mitrella patens verwendet. Fiir die funktionelle Expression dieses 
Gens verwendeten wir den Sacchciromyces cerevisiae-Stainm INVSc 1 
(Invitrogen Co.). E. coli wurde in Luria-Bertini-Brtihe (LB, 

10 Duchefa, Haarlem, Niederlande) bei 31^C kultiviert. Wenn notig, 
wurde Ampicillin (100 mg/Liter) zugegeben, und 1,5 % Agar (Gew./ 
Vol.) wurde ftir feste LB-Medien hinzugeftigt. S. cerevisiae wurde 
bei 30OC entweder in YPG-Medium oder in komplettem Minimalmedium 
ohne Uracil (CMd\im; siehe in: Ausubel, F.M., Brent, R., Kingston, 

15 R.E., Moore, D.D. , Seiditian, J.G,, Smith, J. A., Struhl, K. , 
Albright, L.B., Coen, D.M. , und Varki, A. (1995) Current 
Protocols in Molecular Biology, John Wiley & Sons, New York) 
mit entweder 2 % (Gew. /Vol.) Raffinose oder Glucose kultiviert. 
FUr feste Medien wurden 2 % (Gew. /Vol.) Bacto™-Agar (Difco) 

20 hinzugefiigt. Die zur Klonierung und Expression veirwendeten 
Plasmide sind pUC18 (Pharmacia) und pYES2 (Invitrogen Co.) . 

Beispiel 17: Klonieriing und Expression PUFA-spezif ischer 
Desaturasen aus Phaeodactylum tricornutum 

25 

Ftir die Expression in Hefe wurden die Phaeodactylum tricornutum 
-cDNA-Klone aus Seq ID NO: 1, 3, 5 oder 11 bzw. die Sequenzen 
aus SEQ ID NO: 7 oder 9 bzw andere gewvinschte Sequenzen zuerst so 
modifiziert, dass lediglich die Codierregion mittels Polymerase 

30 Kettenreaktion unter Zuhilfenahme zweier Oligonukleotide ampli- 
fiziert werden. Dabei wurde darauf geachtet, dass eine Konsensu- 
sequenz vor dem Startcodon zur effizienten Translation ein- 
gehalten wurde. Entweder wurde hierzu die Basenfolge ATA oder 
AAA gewShlt und vor das ATG in die Sequenz eingeftigt (Kozak, M. 

35 (1986) Point mutations define a sequence flanking the AUG 
initiator codon that modulates translation by eukaryotic 
ribosomes. Cell 44, 283-292). Vor diesem Konsensustriplett 
wurde zusStzlich eine Restriktionsschnittstelle eingefiihrt, 
die kompatibel sein muss zur Schnittstelle des Zielvektors, 

40 in den das Fragment kloniert werden soil und mit dessen Hilfe 
die Genexpression in Mikroorganismen oder Pflcuizen erfolgen 
soil. 
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Die PCR-Reaktiori wurde mit Plasmid-DNA als Matrize in einem 
Thermocycler (Biometra) mit der Pfu-DNA- (Stratagene) Polymerase 
und dem folgenden Temperatuiprogramm durchgefiihrt : 3 min bei SS'^C, 
gefolgt von 30 Zyklen mit 30 s bei 96^C, 30 s bei 55°C und 2 min 
5 bei 72^C, 1 Zyklus mit 10 min bei 72°C und Stop bei 4°C. Die 
Anlagerungstemperatur wurde je nach gewahlten Oligonukleotiden 
variiert. Pro Kilobasenpaare DNA ist von einer Synthesezeit von 
etwa einer Minute auszugehen. Weitere Parameter, die Einfluss auf 
die PGR haben wie z.B. Mg-Ionen, Salz, DNA Polymerase etc., sind 
10 dem Fachmann auf dem Gebiet gelauf ig und konnen nach Bedarf 
variiert werden. 

Die korrekte Gr6Se des amplif izierten DNA-Fragments wurde mittels 
Agarose-TBE-Gelelektrophorese bestatigt. Die amplif izierte DNA 

15 wurde aus dem Gel iciit dem QIAquick-Gelextraktionskit (QIAGEN) 
extrahiert und in die Smal-Restriktionsstelle des dephosphory- 
lierten Vektors pUC18 \mter Verwendung des Sure Clone Ligations 
Kit (Pharmacia) ligiert, wobei die pUC-Derivate erhalten vmrden. 
Nach der Transformation von E. coli XLl Blue MEIF' kan wurde 

20 eine DNA-MiniprSparation (Riggs, M.G., & McLachlcin, A. (1986) A 
simplified screening procedure for large niambers of plasmid mini- 
preparation. BioTechniques 4, 310-313) an ampicillinresistenten 
Trans formanden durchgefiihrt, und positive Klone mittels BamHI- 
Restriktionsanalyse identifiziert • Die Sequenz des klonierten 

25 PCR-Produktes wurde mittels Resequenzierung unter Verwendung des 
ABI PRISM Big Dye Terminator Cycle Sequencing Ready Reaction Kit 
(Per kin-Elmer, Weiterstadt) bestatigt. 

A5 Acyl Lipid desaturase, Pt_des5 
30 Primer 1 GAG CTC ACA TAA TGG CTC CGG ATG CGG ATA AGC 
Primer 2 CTC GAG TTA CGC CCG TCC GGT CAA GGG 

Das PGR- Fragment (1428bp) wurde mithilfe des Sure Clone Kit 
(Pharmacia) in pUC 18 kloniert, das inserierte Fragment Sacl/Xhol 
35 verdaut \ind das Fragment mithilfe entsprechender Restriktions- 
schnittstellen in pYES2 oder pYES6 inseriert. 

A6 Acyl Lipid desaturaise, Pt_des6 

Primer 3 GGA TCC ACA TAA TGG GCA AAG GAG GGG ACG CTC GGG 
40 Primer 4 CTC GAG TTA CAT GGC GGG TCC ATC GGG 

Das PCR-Fragment (1451 bp) wurde mithilfe des Sure Clone 
Kit (Pharmacia) in pUC 18 kloniert, das inserierte Fragment 
BamHI/XhoI verdaut und das Fragment mithilfe entsprechender 
45 Restriktionsschnittstellen in pYES2 oder pYES6 inseriert. 



wo 02/057464 



PCT/EP02/00461 



105 

A12 Acyl Lipid desaturase, Pt_desl2 

Primer 5 GGA TCC ACA TAA TGG TTC GCT TTT CAA CAG CC 
Primer 6 CTC GAG TTA TTC GCT CGA TAA TTT GC 

5 A12 Acyl Lipid desaturase, Pt_desl2.2 

Primer 7 GGA TCC ACA TAA TGG GTA AGG GAG GTC AAC G 
Primer 8 CTC GAG TCA TGC GGC TTT GTT TCG C 

Das PCR Fragment (1505bp) wurde mithilfe des Sure Clone 
10 Kit (Pharmacia) in pUC 18 kloniert, das inserierte Fragment 
BamHI/XhoI verdaut und das Fragment mithilfe entsprechender 
Restriktionsschnittstellen in pYES2 oder pYESS inseriert. 

Die Plasmid-DNA vnirde mit Restriktionsenzym/en passend zur 
15 eingefiihrten Schnittstelle der Primersequenz gespalten und 
das erhaltene Fragment in die kompatiblen Restriktionsstellen 
des dephosphorylierten Hefe-E. coli-Shuttlevektors pYES2 oder 
pYES6 ligiert, wobei pYES-Derivate erhalten werden. Nach der 
Transformation von E. coli und DNA-Minipraparation aus den 
20 Transf ormanden wurde die Orientierung des DNA-Fragments im 

Vektor durch geeignete Restriktionsspaltung oder Sequenzierung 
liberprtlft. Ein Klon wurde fiir die DNA-Maxipraparation mit dem 
Nucleobond® AX 500 Plasmid-DNA-Extraktionskit (Macherey-Nagel, 
Dtiringen) angezogen, 

25 

Saccharomyces cerevisiae INVScl wurde mit den pYES-Derivaten 
und pYES Leeirvektor mittels eines PEG/Lithiumacetat-Protokolls 
transf ormiert (Ausubel et al,, 1995). Nach der Selektion 
auf CMdum-Agarplatten mit 2 % Glucose wurden pYES-Derivate- 
30 Transf ormanden xind eine pYES2-Transformande z\ir weiteren Anzucht 
und funktionellen Expression ausgewShlt. Bei pYES6-Derivaten 
wurde Blasticidin als Antimetabolit verwendet. Im Fall von 
Coexpressionen auf Basis von pYES2 und pYES6 wurde auf Minimal- 
medium mit Blasticidin selektiert. 

35 

Funktionelle Expression einer DesaturaseaktivitSt in Hefe 
Vorkultur 

40 20 ml CI^um-Fltlssigmedium ohne Uracil aber mit 2 % (Gew./Vol.) 
Raffinose wurden mit den transgenen Hefeklonen (pYES2) angeimpft 
\md 3 Tage bei SO^'C, 200 rpm gezQchtet, bis eine optische Dichte 
bei 600 nm (ODsoo) von 1,5 bis 2 erreicht wurde. Wurde als Vektor 
pYES6 veirwendet, so wurde zusStzlich auf Blasticidin als Anti- 

45 metabolit selektioniert . 
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Hauptkultur 

Far die Expression wurden 20 ml CMdum-Fiassigmediim ohne Uracil 
aber mit 2 % Raffinose und 1 % (Vol. /Vol.) Tergitol NP-40 
5 mit FettsSuresubstraten auf eine Endkonzentration von 0,003 % 
(Gew,/Vol.) angereichert . Die Medien wurden mit den Vorkultiiren 
auf eine ODeoo von 0,05 angeimpft. Die Expression wurde bei einer 
ODeoo von 0,2 mit 2 % (Gew./Vol.) Galaktose fiir 16 Std. induziert, 
wonach die Kulturen eine ODeoo von 0,8-1,2 geerntet wurden. 

10 

Fettsaureanalyse 

Die Gesamt-Fettsauren wurden aus Hefekulturen extrahiert und 
mittels Gaschromatographie analysiert. Davon wurden Zellen von 5 

15 ml Kultur mittels Zentrifugation (1000 x g, 10 min, geerntet 
xmd einmal mit 100 mM NaHCOa, pH 8,0, gewaschen, urn restliches 
Medium und Fettsauren zu entfernen. Zur Herstellxing des Fett- 
sauremethylester (FAMES oder Singular FAME) wurden die Zell- 
sedimente mit 1 M methanolischer H2SO4 \ind 2 % (Vol . /Vol . ) 

20 Dimethoxypropan fOr 1 Std. bei 80°C behandelt. Die FAMES wurden 
zweimal mit 2 ml Petrolether extrahiert, einmal mit 100 mM NaHCOs, 
pH 8,0, und einmal mit destilliertem Wasser gewaschen und mit 
Na2S04 getrocknet. Das organische Losungsmittel wurde unter einem 
Argonstrom verdampft, und die FAMES wurden in 50 mikrol Petrol- 

25 ether gel6st. Die Proben wurden auf einer ZEBRON-ZB-Wax-Kapillar- 
saule (30 m, 0,32 ram, 0,25 mikro m; Phenomenex) in einem Hewlett 
Packard-6850-Gaschromatograph mit einem Flammenionisations- 
detektor aufgetrennt. Die Of entemperatxir wurde von TO^'C (1 min 
halten) bis 200°C mit einer Rate von 20''C/min, dann auf 250*'C 

30 (5 min halten) mit einer Rate von 5**C/min und schlieElich auf 
260*'C mit einer Rate von 5°C/min programmiert . Stickstoff wurde 
als Tragergas verwendet (4,5 ml/min bei 70°C) . Die FettsSuren 
wurden durch Vergleich mit Re tent ions zei ten von FAME-Standards 
(SIGMA) identifiziert. 

35 

Expressionsanalyse 

Die Verhaitnisse der zugegebenen und aufgenommenen Fettsaure- 
substrate wurden ermittelt und so Quantitat und Qualitat der 
40 Desaturasereaktion gem^fi Tabelle 6, Tabelle 7 und Tabelle 8 
erf asst. 



Ergebnis der Expression einer Phaeodactylum tricornutum A-6-Acyl 
Lipid Desaturase in Hefe: 

45 
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Tabelle 6 



10 



FettScLure 


pYes2 


pYes2-Ptd6 gefattert mit 




- 


- 


+18:2 


+18:3 


16:0 


13,3 


18,9 


28,4 


16,7 


16:1A9 


45,4 


44,7 


12,5 


16,9 


16:2A6,9 




4,3 






18:0 


4,9 


6,3 


10,4 


9,1 


18:1A9 


36,4 


24,1 


6,8 


11,8 


18:2A6,9 




1.8 






18:2A9,12 






33,4 




18:3A6,12,15 






4,9 




18:3A9,12,15 








43,1 


18:4A6,9,12,15 








2,3 



15 Die Angaben stellen Mol-% entsprechender cis-Fetts^uren dar. 

Ergebnis der Expression einer PhaeodactylTXDCi tricornutum A-5-Acyl 
Lipid Desaturase in Hefe: 

20 Tabelle 7 

pYES2 pYES_PtD5-Konstrukt gefattert mit 



Fett- Kon- . 





saure Leer 


trollel8:2 18:3 


20:1 


-20:1 


20:2 


20:3 


20:3 


25 








A8 


AU 


All,14 


OB 


Q6 




16:0A 16,9 


20,4 


27,7 24,4 


16,2 


21 


17,6 


19,5 


22,8 




16:1A9 44,7 


44,1 


13,2 9,6 


37,4 


39,4 


38,3 


36,9 


30,7 




18:0 6,1 


6,9 


10,54 9,8 


4,7 


7,9 


6,3 


6,8 


8,2 




18:1A9 31,72 


28,1 


8,77 6 


15 


26 


29,5 


25,6 


21,1 


30 


18:2A5,9 


0,17 


0 0 


0 


0,09 


0,21 


0,09 


9 




18 : 2 A9,12 




39,7 - 














18:3 A9, 12, 15 




49,9 














20:1 AS 






25,5 












20:lAil 








5,41 








35 


20:2 A5, 11 








0,21 










20:2 All, 14 










6,48 








20:3 A5, 11,14 










0,76 








20:3 All, 14, 17 












9,83 






20:3 A8, 11, 14 














13,6! 


40 


20:4A5,11,14,17 












1,16 






20:4A5,8,11,14 














3,08 



Die Angaben stellen Mol-% Fetts^uren von cls-Fettsaiiren dar. 
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Aus den Substratuinsetzungen geht hervor, dass die verwendete 
^--5-Desaturase aus Phaeodactylum und die A-6-Elongase aus 
Physcomitrella patens bzgl. der Substrataktivitat und ins- 
besondere der Substratspezifit&t geeignet sind, um Arachidon- 
5 sSure bzw. EicosapentaensSure mithilfe erf indungsgemSfier 
Sequenzen zu produzieren. 

Die Fragmentierungsmuster \md Massenspektren von DMOX-Derivaten 
von Standards als auch den Peakfraktionen per GC identif izierter 
10 Fettsauren der in Tabelle 6, 7 und 8 aufgefiihrten, zeigen 
vergleichsweise identische Ergebnisse, wodurch die jeweilige 
Position der Doppelbindung liber die bloSe GC-Detektion hinaus 
abgesichert wurde, 

15 Beispiel 18: Reinigung des gewiinschten Produktes aus 
trans formier ten Orgcinismen 

Die Gewinnung des gewiinschten Produktes aus Pf lanzenmaterial Oder 
Pilzen, Algen, Ciliaten, tierischen Zellen oder aus dem Uber stand 

20 der vorstehend beschriebenen Kulturen kann durch verschiedene, 
im Fachgebiet bekannte Verfahren erfolgen. Wird das gewiinschte 
Produkt nicht aus den Zellen sezerniert, kSnnen die Zellen aus 
der Kultur durch langsame Zentrifugation geerntet warden, die 
Zellen konnen durch Standardtechniken, wie mechanische Kraft oder 

25 Ultraschallbehcindliing, lysiert werden. Organe von Pflanzen konnen 
mechanisch von anderein Gewebe oder anderen Organen getrennt 
werden. Nach der Homogenisation werden die Zelltrttmmer durch 
Zentrifugation entfemt, und die Uberstandsfraktion, welche 
die Idslichen Proteine enthS.lt, wird zur weiteren ReinigiHig 

30 der gewiinschten Verbindung aufbewahrt. Wird das Produkt aus 
gewiinschten Zellen sezerniert, werden die Zellen diirch langsame 
Zentrifugation aus der Kultur entfernt, und die ttberstands- 
fraktion wird zur weiteren Reinigung aufbewahrt. 

35 Die Oberstandsfraktion aus jedem Reinigungs verfahren wird einer 
Chromatographie mit einem geeigneten Harz unterworfen, wobei das 
gewiinschte Molekiil entweder auf dem Chromatographieharz zurtick- 
gehalten wird, viele Verxinreinigungen in der Probe jedoch nicht, 
Oder die Veriinreinigungen auf dem Harz zuriickbleiben, die Probe 

40 hingegen nicht. Diese Chromatographieschritte kSnnen wenn nStig 
wiederholt werden, wobei die gleichen oder andere Chromato- 
graphieharze verwendet werden. Der Fachmann ist in der Auswahl 
geeigneter Chromatographieharz e und ihrer wirksamsten Anwendung 
fiir ein bestimmtes zu reinigendes Molekiil bewandert. Das 

45 gereinigte Produkt kann durch Filtration oder Ultrafiltration 
konzentriert und bei einer Tempera tur aufbewahrt werden, bei 
der die StabilitMt des Prodtiktes maximal ist. 
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Aus weiteren Filtterungsversuchen wurde gef\inden, dass C18:1A9 in 
der Anwesenheit von C18:2A9,11 Oder C18:3 A9,12, 15 Oder C20:1A8 
Fettscluren nicht desaturiert wurde w3hrend in Anwesenheit von 
C20:1A11, C20:2A11,14 und C20:3A8,11,14 auch C18:l desaturiert 
5 wird. Ebenfalls keine Desaturienmg erfolgte in Anwesenheit von 
C20:3 A8,ll,14. 

Bei Nutzung des Protease-defizienten Hefestammes C13BYS86 (Kunze 
I. et al., Biochemica et Biophysica Acta (1999) 1410:287-298) fiir 

10 die Expression der A-5-Desaturase aus Phaeodactylxom tricornutum 
auf Vollmedium mit Blasticidin wurde gefunden, dass C20:4 
A8,l 1,14,17 als Substrat der A-5-Desaturase mit 20 % Umsatzrate 
ebenso gut umgesetzt wurde wie C20:3 AS, 11, 14. Altemativ konnen 
auch die Avixotrophiemarker leu2, ura3 oder his ftir Genexpression 

15 genutzt werden. 

In einem weiteren Coexpressionsexperiment von A-5 Desaturase aus 
Phaeodactyliam und A-6 Elongase aus Physcomitrella wurde der Stamm 
UTL7A (Wamecke et al., J, Biol. Chem. (1999) 
20 274(19) :13048-13059)benutzt, wobei die A-5 Desaturase ca 10 % 
C20:3 AS, 11, 14 zu C20:4 A5,8,ll,14 xunsetzte. 

Weitere Ftttterungsexperimente mit vers chiedens ten anderen 
FettsSuren allein oder in Kombination (z.B. LinolsSure, 20:3 
25 A-5, 11, 14-Fettsaure, alpha- oder gamma Linolens^ure , Stearidon- 
sSure, Arachidons£Lure, EicosapentaensSure etc.) konnen z\ir 
detaillierteren BestStigung der Substratspezifitat und 
-Selektivitat dieser Desat\irasen durchgeftihrt werden. 



30 Tabelle 8: 



Ergebnis der Coxpression einer Phaeodactylum tri- 
cornutim A-5-Acyl Lipid Desaturase und einer A-6 
Elongase aus Moos in Hefe auf Basis der Expressions- 
vektoren pYes2 vmd pYes6 



35 

16:0 
16 : 1A9 
18:0 
18:1A9 
18:3A6,9,12 
18:4A6,9,12,15 
20:3A8,11,14 
45 20:4A5,8,11,14 



pYes2-Elo 



40 



+18:3 
15,0 
27,7 
5,6 
17,1 
7,60 

15,92 



20:4A8,11,14,17 
20:5A5,8,11,14,17 - 



+18:4 
14,8 
29,2 
6,3 
30,8 

6,71 



11,4 



pYes2-Elo and pYes6-Ptd5 

+18:4 
15,1 
29,0 
6,4 
31,6 

6,4 



+18:3 
15,6 
27,5 

5,7 
27,4 

7,8 

13,55 
1,31 



10,31 
0,53 
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Aus den Substratiiitisetzungen geht hervor, dass die verwendete 
A-5-Desaturase aus Phaeodactylum und die A-6-Elongase aus 
Physcomitrella patens bzgl. der Substrataktivitat vind ins- 
besondere der Substratspezifitat geeignet sind, um Arachidon- 
5 saure bzw- EicosapentaensSure mithilfe erfindungsgemSfier 
Sequenzen zu produzieren. 

Die Fragmentierungsmuster und Massenspektren von DMOX-Derivaten 
von Stctndards als auch den Peakfraktionen per GC identif izierter 
10 Fettsauren der in Tabelle 6/ 7 und 8 aufgefiihrten, zeigen 
vergleichsweise identische Ergebnisse, wodurch die jeweilige 
Position der Doppelbindung iiber die bloSe GC-Detektion hinaus 
abgesichert wurde, 

15 Beispiel 18: Reinigxing des gewiinschten Produktes aus 
trans formier ten Organismen 

Die Gewinnung des gewiinschten Produktes aus Pf lanzenmaterial oder 
Pilzen, Algen, Ciliaten, tierischen Zellen oder aus dem Uberstand 

20 der vorstehend beschriebenen Kulturen kann durch verschiedene, 
im Fachgebiet bekannte Verfahren erfolgen. Wird das gewUnschte 
Produkt nicht aus den Zellen sezemiert, konnen die Zellen aus 
der Kultur durch langsame Zentrifugation geerntet warden, die 
Zellen konnen durch Standardtechniken, wie mechanische Kraft oder 

25 Ultraschallbehandl\jng/ lysiert werden. Organe von Pflanzen kSnnen 
mechanisch von anderem Gewebe oder anderen Organen getrennt 
werden. Nach der Homogenisation werden die Zelltriimmer durch 
Zentrifugation entfemt, und die Uberstandsfraktion, welche 
die 15slichen Proteine enthSlt, wird zur weiteren Reinigung 

30 der gewiinschten Verbind\ang aufbewahrt. Wird das Produkt aus 

gewiinschten Zellen sezemiert/ werden die Zellen durch langsame 
Zentrifugation aus der Kultur entfemt, und die Oberstands- 
fraktion wird zur weiteren Reinigung aufbewahrt - 

35 Die Oberstandsfraktion aus jedem Reinigungsverfahren wird einer 
Chromatographie mit einem geeigneten Harz unterworfen, wobei das 
gewilnschte Molekul entweder auf dem Chromatographieharz zuriick- 
gehalten wird, viele Verunreinigungen in der Probe jedoch nicht, 
Oder die Verxinreinigungen auf dem Harz zurilckbleiben, die Probe 
• 40 hingegen nicht. Diese Chromatographieschritte kOnnen wenn notig 
wiederholt werden, wobei die gleichen oder andere Chromato- 
graphieharze verwendet werden. Der Fachmann ist in der Auswahl 
geeigneter Chromatographieharze und ihrer wirksamsten Anwendung 
fiir ein bestiramtes zu reinigendes Molekiil bewandert. Das 

45 gereinigte Prodiikt kann durch Filtration oder Ultrafiltration 
konzentriert und bei einer Temperatur aufbewahlrt werden, bei 
der die StabllitSt des Produktes maximal ist« 
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Im Fachgebiet ist ein breites Spektnam an Reinigungsverfahren 
bekannt, und das vorstehende Reinigxingsverfahren soli nicht 
beschrankend sein. Diese Reinigungsverfahren sind zum Bei- 
spiel beschrieben in Bailey, J.E,, & Ollis, D.F., Biochemical 
5 Engineering Fundamentals, McGraw-Hill: New York (1986). 

Die Identitat und Reinheit der isolierten Verbindungen kann 
durch Standardtechniken des Fachgebiets bestimmt warden. Dazu ge- 
horen Hochleistungs-Fltissigkeitschromatographie (HPLC) , spektro- 

10 skopische Verfahren, FSrbeverf ahren, EKinnschicht chromatographies 
insbesondere Dtonschichtchromatographie und Flammenionisations- 
detektion (lATROSCAN, latron, Tokio, Japan), NIRS, Enzymtest oder 
mikrobiologisch. Eine Ubersicht tlber diese Analyseverfahren siehe 
in: Patek et al. (1994) Appl. Environ. Microbiol. 60:133--140; 

15 Malakhova et al. (1996) Biotekhnologiya 11:27-32; und Schmidt et 
al. (1998) Bioprocess Engineer. 19:67-70, Ulmann's Encyclopedia 
of Industrial Chemistry (1996) Bd. A27, VCH: Weinheim, S. 89-90, 
S. 521-540, S. 540-547, S. 559-566, 575-581 und S. 581-587; 
Michal, G (1999) Biochemical Pathways: An Atlas of Biochemistry 

20 and Molecular Biology, John Wiley and Sons; Fallon, A., et al. 
(1987) Applications of HPLC in Biochemistry in: Laboratory 
Techniques in Biochemistry and Molecular Biology, Bd. 17. 

Aquivalente 

25 

Der Fachmann erkennt oder kann viele Aquivalente der hier 
beschriebenen erf indungsgemSiSen spezifischen Ausfiihrungsf ormen 
feststellen, indem er lediglich Routineexperimente verwendet. 
Diese Aquivalente sollen von den Patentansprtichen umfasst sein. 
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Patentansprtiche 



1. Expressionskassette mit einer Strukt\ir ausgewahlt aus der 
5 Gruppe : 



a) LI - Promo tor - Strukturgen - L2, 



b) LI - Promoter - Strukturgen - L2 - Ll - Promoter - Struk- 
10 turgen - L2, 

c) LI - Promoter - Strukturgen - L2 - Ll - Promoter - Struk- 
turgen - L2 - Ll - Promoter - Strukturgen - L2, 

15 wobei LI, L2, Promoter und Strukturgen die folgende Bedeutung 
hat: 

Ll = SEQ ID NO: 32 oder eine aquivalente Restriktiensschnitt- 
stellen enthaltende Sequenz, 
20 L2 = unabhSngig voneinander SEQ ID NO: 33, 34 oder 35 oder 

Aquivalente Restriktionsschnittstellen enthaltende Se- 
quenzen, 

Promotor = pflanzlicher Promoter 
Strukturgen = eine in Pflanzen exprimierbare 
25 NukleinsSxiresequenz . 

2. Expressionskassette nach Anspruch 1, wobei das Strukt\irgen 
ein Biosynthesegen ist. 

30 3. Expressionskassette nach Anspruch 1 oder 2, wobei das Struk- 
turgen ein Biosynthesegen des Lipid- oder FettsSurestof fwech- 
sels ist. 

4. Expressionskassette nach den Anspriiche 1 bis 3, wobei das 
35 Strukturgen ein pflanzliches Gen ist. 
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5. Expressionskassette nach den Anspriiche 1 bis 4, wobei das Gen 
eine Nukleinsauresequenz ist, die far Proteine ausgewShlt aus 

der Gruppe : 

Acyl-CoA-Dehydrogenase (n) , Acyl-ACP[= acyl carrier protein] - 
5 Desaturase (n) , Acyl-ACP-Thioesterase (n> , Fettsaure-Acyl- 

Transferase(n) , Fettsaiire-Synthase(n) , Fettsaure-Hydroxy- 
lase{n), Acetyl-Coenzym A-Carboxylase (n) , Acyl-Coen- 
zym A-Oxidase (n) , Fettsaure-Desaturase (n) , Fettsaure- 
Acetylenasen, Lipoxygenasen, Triacylglycerol-Lipasen, 
10 Allenoxid-Synthasen, Hydroperoxid-Lyasen oder FettsSure- 
Elongase (n ) , kodiert . 



15 



Expressionskassette nach den Anspriiche 1 bis 5, wobei das Gen 
eine Nukleinsauresequenz ausgewfihlt aus der Gruppe ist: 

a) einer Nukleinsauresequenz mit der in SEQ ID NO: 1, 
SEQ ID NO: 3, SEQ ID NO: 5 Oder SEQ ID NO: 11 dar- 
gestellten Sequenz, 



20 b) Nukleinsauresequenzen, die aufgrund des degenerierten 

genetischen Codes durch Ruckubersetzung der in 
SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6 Oder 
SEQ ID NO: 12 dargestellten AminoscLuresequenzen 
erhalten werden, 

25 

c) Derivate der in SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5 
Oder SEQ ID NO: 11 dargestellten Nukleinsauresequenz, die 
fur Polypeptide mit der in SEQ ID NO: 2, SEQ ID NO: 4, 
SEQ ID NO: 6 Oder SEQ ID NO: 12 dargestellten Aminosaiire- 
30 sequenzen codieren und mindestens 50 % Homologie auf 

Aminos^ureebene aufweisen, ohne daS die enzymatische 
Wirkung der Polypeptide wesentlich reduziert ist. 



7 . Verwendung von Expressionskassetten gemtS den AnspUchen 1 bis 
35 6 in einem Verfahren zur Herstellung von Fettsaureestern mit 

einem erhohtem Gehalt an mehrfach ungesattigten Fettsauren 
mit mindestens zwei Doppelbindxingen dadurch gekennzeichnet, 
dafi man die Expressionskassette in einen FettsSureester pro- 
duzierenden Organismus einbringt, anzieht \md die in dem Or- 
40 ganismus enthaltenen FettsSureester isoliert. . 

8. Verfahren nach Anspruch 7, wobei die durch das Verfahren 
hergestellten FettsSureester mehrfach ungeScLttigte Cis-; C20^ 
Oder C22-F6ttsauremolektile mit mindestens zwei Doppelbindungen 

45 im Fettsaureester enthalten. 
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9. Verfahren nach Anspruch 7 oder 8, wobei die Cib". C2o~ oder 
C22-Fettsauremolek\ile aus dem Organisitius in Form eines Ols, 
Lipids isoliert werden. 

5 10, Verfahren nach den Anspriichen 7 bis 9, wobei der Organismus 
eine transgene Pflanze ist. 

11. Verfahren nach den Anspriichen 7 bis 10, wobei die Fettsaure- 
ester Cxq-, C20*" oder C22^Fettsauren mit drei, vier oder fllnf 

10 Doppelbindungen im Pettsaureester enthalten. 

12. Verfahren nach den Ansprtichen 7 bis 11, dadurch gekenn- 
zeichnet, daS man die in den FettsSureestern enthaltenden 
mehrfach iingescLttigtfen Fettsauren freisetzt- 

15 

13. Vektor enthaltend eine Expressionskassette gemSfi den Ansprii- 
chen 1 bis 6. 

14. Organismus enthaltend mindestens eine Expressionskassette ge- 
20 mas den Anspriichen 1 bis 6 oder mindestens einen Vektor gemafi 

Anspruch 13 . 

15. Organismus nach Anspruch 14, wobei es sich bei dem Organismus 
urn eine Pflanze handelt. 

25 

16. Transgene Pflanze enthaltend eine funktionelle oder nicht 
funktionelle Nukleinsauresec^ienz in einer Expressionskassette 
gemaS den Anspruchen 1 bis 6. 

30 17. Verwendung einer einer Expressionskassette gemafi den Anspru- 
chen 1 bis 6 zur Herstelliing von transgenen Pflanzen. 
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Figur 1; Polypeptidvergleich der Codierregionen von Pp_des 6 (obere 
Reihe) mit der EST-Sequenz von PT001078032R (untere Reihe) 

398 WKPLVWMAVTELMSGMLLGFVFVLSHNGMEVYNSSKEFVSAQI VSTR 444 

W+ + + + + L +F LSHN ■»- S+ +A + V T 

430 WRVFGNIMLMGVAESLALAVLFSLSHN-— FES ADRDPTAPLKKTGEPVDWFKTQVETS 263 
445 DIKGNIFNDWFTGGLimQIEHHLFPTMPRHISnJNKIAPRVEWCKKHGLV^ 494 

G + FTGGLN Q+EHHLFP M lAP+V C KHG+ Y 

262 CTYGGFLSGCFTGGLNFQVEHHLFPRMSSAWYXYIAPKVREICAKHGVHY 113 



Figur 2; Polypeptidvergleich von Codierregionen der Ma_desl2 
(obere Sequenz) mit PT001070010R 

105 GVWVLAHECGHQSFSTSKTLNN 126 

G WVLAHECGH +FS +++L + 
533 GPWVIiAHECGHGAFSKNRSLQD 598 



Figur 2a: Polypeptidvergleich von Codierregionen der Ma_desl2 
(obere Sequenz) mit PT001072031R 

117 SFSTSKTLl«iTVGWILHSMLLVPYHSWRISHSKHH 151 

++S S+T N+ VG+I+H LLVPY +W+ +H+KHH 
465 AYSDSQTFNDWGFIVHQALIiVPYFAWQYTHAKHH 569 



Figur 3: Polypeptidvergleich von Codierregionen eines PGR 

Produktes aus Primerpaar F6a und R4a2 codierend filt ein 
Desaturase Fragment (obere Reihe) aus Phaodactylum mit 
der Sequenz T36617 aus Streptomyces coelicolor (untere 
Reihe) 

1 WWKNKHNGHHAVPNLHCSSAVAQDGDPDIDTMPLLAWSVQQAQSYRELQADGKDSGLVCT 60 
WW++KH HHA PN +D DPDI LL WS QA++ +GL + 

114 WWQDKHTRHHANPN TEDLDPDIGP-DLLVWSPDQARAA TGLPRL 156 

61 MIRNQSYFYFPILLLARLSWLNESFKCAFGLGAASENAALELKAKGIiQYPLLEKAGIIJ^H 120 
+ R Q++ +FP+L L • E F 6 A N L+ +A L+ A +L H 

157 LGRWQAFLFFPIiLTL EGFNLHVASGRAMANRRLKRRA LDGALLLAH 202 

121 YAWMLWSSGFGRXXXXXXXXXXXXXXXXCGFLIJU:VFGLGHNGMATYNADARPDFWKLQ 180 

AIiTF -GLFHGMAD RPDF + Q 

203 CAVYLTAL — ETm*PPGMAIAFI*AVHQCIiFGVYLGSAFAPNHKGMPILTADDRPDPLRRQ 260 
181 VTTTRNVTGGHGFPQAFVDWFCGGLQYQVDHHLFPS 216 

V T+RNV GG F D GGL +Q++HHLFPS 

261 VLTSRNVNGG LFTDLALGGLNHQIEHHLFPS 291 
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Figur 4: Polypeptidvergleich von Codierregionen aus Pp_des6 
(obere Reihe) verglichen mit Pt_des6 (untere Reihe) 

51 KRLTSKKRVSESAAVQCISAEVQRNSSTQGTAEALiAESVVKPTRRRSSQW 100 

1 MGKGGDARASKG 12 

101 KKSTHPIiS. .EVAVHNKPSDCWIVVKNKVYDVSNFMEH^ 148 

. :1 1! I M Ih IIMIIII. IIIIMI h I 

13 STAARKISWQEVKTHASPEDAWIIHSNKVYDVSNW.HEHPGGAVIFTHAG 61 
149 lUXSTDVFSSPHAASTWKIIiQDFYIGDV. .ERVEPTPELL. • •KDFREMRA 193 
62 DDMTDIFAAFHAPGSQSLMKKFYIGEIiLPETTGKEPQQIAFEKGYRDLRS 111 

194 LFLREQLFKSSKLYYVMKLLTNVAIFAASIAIICWSKTISAVLASAC^^ 243 

: :|IM :|| I M-IMl- h: :| Nil I 

112 KLimGiynFKSNKWFYVYKCLSNMAIWAAACALVFYSDRF^^ 161 

244 LCFQQCGWLSHDPIJmQVFETRWIiNEWGyVIGNAVLGFSTGV^^ 293 

III IIMMIMI! I I II * I:| Ml Ml 

162 TFFQQSGWLAHDFLHHQVFTKRKHGDIiGGLFWGNLMQGYSVQWWKNK^ 211 

294 HHAAPN.ECDQTY.QPIDEDIDTLPLIAWS KDIIiATVENKTFL 334 

Ml Ml II IMhlMMl ::: I • 

212 HHAVPNLHCSSAVAQDGDPDIDTMPLLAWSVQQAQSYRELQADGKDSGLV 261 

335 R.IIiQYQHLFFKGLLFFARGSWLFWSWR YTSTAVLSPVDR. , . 373 

: I h M M III I- . I I : 

262 KFMIMTQSYFYFPILLLARLSWLNESFKCAFGLGAASENAAL 311 

374 . .LLEKGTVLFHYFWFVGTAC.YLLPGWKPLVWl^VTELMS.GMLLGFVF 419 

MM :|Mi • . . . .1 II II M 

312 YPLLEKAGILLHYAWMLTVSSGFGRFSFAYTAFYFLTATASCGFIiLAIVF 361 

420 VLSHNGMEVYNSS. .KEFVSAQIVSTRDIKG NIFNDWFTGGLNRQ 462 

I MM IM M I: -IM: I I Ml Ml I 

362 GLGHNGMATYNADARPDFWKLQVTTTRNVTGGHGFPQAFVD^^ 111 

463 lEHHLFPTMPRHNLl^IAPRVEVFCKKHGLVYEDVSIATGTCKVLKALKE 512 

::MMM:iMM I M MM M I : : M Ml I 
412 VDHHLFPSLPRHNIiAKTHALVESFCKEWGVQYHEADLVIXSTMEV^ 461 

513 VAEAAAEQHATTS 525 

II I 
462 VAGEFWDFVRDGPAM. 477 
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Figur 5: Polypeptidvergleich von Codierregionen aus Pp_des6 
(obere Reihe) verglichen mit Pt_des5 (tontere Reihe) 

51 KRLTSKKRVSESAAVQCISAEVQRNSSTQGTAEALAESWKPTRRRSSQW 100 

:| I .|... 

1 MAPDADKLRQRQTTAV 16 

101 KKSTHPLSEVAVHNKPSDC WIWKNKVYDVSNFADEHPGGSVIS 144 

II.:.: : : :||. -I HIM I 

17 AK. .HNAATISTQERLCSLSSLKGEEVCIDGIIYDLQSF. .DHPGGETIK 62 

• • • • ■ 

145 TYFGRDGTDVFSSFHAASTWKILQDF.YIGDVERVEPTPELLKDF.REM. 191 

: I II : I I Ih HI . :| II. 

63 MFGGNDVTVQYKMIHPYHTEKHLEKMKRVGKVTDFVCEYKFDTEFEREIK 112 

192 RMiFLREQLFKS.SKLYYVMKLLTNVAIFAASIAIICWSKT.ISAVIiASA 239 

I .1 . I I : : :|ll I I I -III 

113 REVFKIVRRGKDFGTLGWFFRAFCYIAIF. .FYLQYHWVTTGTSWLLAVA 160 

240 CMMALCFQQCGWLSHDFIiHNQVFETRWLNEVVGYVIGNAVLGFSTGWWKE 289 

.111- |.h..| :| :| I I.| 
161 YGISQAMIGMN.VQHDANHGATSKRPWVNDMLG. .LGADFIGGSKWLWQE 207 

290 KHNLHHAAPNECDQTYQPIDEDIDTLPLIAWSKDILATVENKTFLRILQY 339 

.1 111 1 : I : I- I :M • = 

208 QHWTHHAYTNHAEM. .DP. .DSFGAEPMLLFN.DYPLDHPARTWLH, .RF 250 

340 QHLFFMGLLFFARGSWLFWSWR YTSTAVLS . . . PVDRLLEKGTVL 381 

I hi .1 III. li H 

251 QAFFYMPVL. . .AGYWLSAVFNPQILDLQQRGALSVGIRLDNAFIHSRRK 297 

382 FHYFW...FVG TACYLLPG WKPLVWMAVTELMSGMLLGFVFV 420 

: II :: II h . . . : j .| 

298 YAVFWRAVYIAVNVIAPFYTNSGLEWSWRVFGNIMLMGVAESLALAVLFS 347 

421 LSHN GMEVYNSSKEFVSAQIVSTRDIKGWIFNDWFTGGLN 460 

MM M I I . IMMI 

348 LSHNFESADRDPTAPLKKTGEPVDWFKTQ.VETSCTYGGFLSGCFTGGIiN 396 

461 RQIEHHLFPTMPRHNLNKIAPRVEVFCKKHGLVYEDVS . lATGTCKVLKA 509 

|:|MIII I llhl I MM I I 

397 FQVEHHLFPRMSSAWYPYIAPKVREICAKHGraYAYYPWIHQNFLSTVRY 446 

510 LKEVAEAAA.EQHATTS 525 

III. I 
447 MHAAGTGANWRQMARENPLTGRA. 469 
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Figur 6: Polypeptidvergleich von Codierregionen der A-12-Desatu- 
rase aus Mortierella alpina (Ma_desl2) obere Reihe mit 
der homologen Sequenz aus Phaeodactylum tricornutiom 
(Pt_desl2) in der \mteren Reihe 

40 KEIRECIPAHCFERSGLRGLCHVAIDLTWASLL. .FLAATQIDKFE. .NP 85 

|::| II III : I I ^:| • I : : II 

107 KDLRAVIPKDCFEPDTAKSLGYLSVS.TMGTILCSWGANLLSVLDPSNP 155 

86 lilRYLAWPVYWIMQGIVCTGVWVIAHECGHQSFSTSKTLNNTVGWILHSM 135 

I : I I . II MillMIII .11 *:.| • IhhII. 
156 L.TWPLWAAYGAVTGTVAMGLWVLAHECGHGAFSKNRSLQDAVGYIIHSI 204 

136 LLVPYHSWRISHSKHHKATGHMTKDQVFVPKTRSQVGLPPKENAAAAVQE 185 

:|||| II* Ih 11- III : II .1 I . I I 

205 MLVPYFSWQRSHAVHHQYTNHMELGETHVPDRADKEG EKSLALRQF 250 

186 EDMSVHLDEEAPIVTLFWMVIQFLFGWPAYLIMNASGQDYGRWTSHFHTY 235 

II. : : lllllh. M Mh 

251 MLDSFGKDKGMKAYGGLQSFLHLIVGWPAYLLIGATGGPDRGMTNHFYP. 299 

236 SPIFEP RNFF DIIISDLGVLAALGALIYASMQLSLLTVTK 275 

.|: I : I : Ihh I •MM • I I 

300 NPLSTPTQPKKELFPGNWKEKVYQSDIGIAAWGALIAWTATSGLAPVMA 349 

276 YYIVPYLFVNFWLVLITFLQHTDPKLPHYREGAVmFQRGALCTVDRSFGK 325 

I I : :| MM Mini Ml: II MM IMI : I 

350 LYGGPLIVINAWLVLYTWLQHTDTDVPHFSSDNHNFVKGALHTIDRPYDK 399 

326 FLDHMFHGIVHTHVAHHLFSQMPFYHAEEATYHLKKLLGEYYVYD 370 

M : II llllll 1 M II: II M I Ml 
400 LDPWGIIDFLHHKIGTTHVAHHFDSTIPHYKAQIATDAIKAKFPEVYLYD 449 

371 PSPIWAVWRSFRECRPVEDQGDWFFK 398 

IMI IMI : I II Ml M 
450 PTPIPQAKWRVAKGCTAVEQRGDAWVWK 477 
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Figur 7: Polypeptidvergleich von Codierregionen der 

Desaturase aus Mortierella alpina (Ma_desl2) obere 
Reihe mit der homologen Sequenz aus Phaeodactylum tri- 
comutiam Klon PT001072031R (Pt_desl2.2) in der xinteren 
Reihe . 

22 NSAKPAFERNYQLPEFTIKEIRECIPAHCFERSGLRGLCHVAIDLTWASIj 71 

.1 I . . :|| I :|: II Ihll - II h 

33 SSYNPLAKDSPELP. -TKGQIKAVIPKECFQRSAFWSTFYLMRDLAMAAA 80 

• • • • • 

72 LFLAATQIDKFENP LIRYLAWPVYWIMQGIVCTGVWVLAHECGH 115 

.|; : I i II II I : II IMIIIII 

81 FCYGTSQVLSTDLPQDATLILPWALGWGVYAFWMGTILTGPWWAHECGH 130 

116 QSFSTSKTLNNTVGWILHSMLLVPYHSWRISHSKHHKATGHMTKDQVFVP 165 

.:] M I. IM.I Mill .|. -Mlh II: : II 
131 GAYSDSQTFNDWGFIVHQALLVPYFAWQYTOAKHHRRTNHLVIXSESHW 180 

166 KTRSQVGLPP . . KENAAAAVQEEDMSVHLDEEAPIVTLFWMVIQFLFGWP 213 

I III . |. I I I : 1 I I III 

181 STAKDNGLGPHNERNSFYAAWHEAMG DGAFAVFQVWS . . HLFVCWP 224 

214 AYLI.MNASGQ. .DYGRW TSHFHTYSPIFEPRNFFDIIISDLG 253 

II : ..|. I I II IM : I :| 

225 LYLAGLASTGKLAHEGWWLEERNAIADHFRPSSPMFPAKIRAKIALSSAT 274 

254 VIAALGALIYASMQLSLLTVTKYYIVPYLFWFWLVLITFLQHTDPKLPH 303 

II I hi I. II :i II III III! Minn ni 

275 ELAVLAGIiLYVGTQVGHLPVLLWYWGPYTFVNAWLVLYTWLQHTDPSIPH 324 

• • • • • 
304 YREGAWNFQRGALCTVDRSFGKFLDHMFHGIVHTHVAHHLFSQMPFYHAE 353 

Ml M nil Ml nil I I III nil ninn 

325 YGEGEWTWVKGALSTIDRDYGIF.DFFHHTIGSTHWHHIiFHEMPWYNAG 373 

• a • • 

354 EATYHLKKLLGE. .YYVYDPSPIWAVWRSFRECRFVEDQGDWFFK 398 

n n- I I MM Ml I I ni i ni 

374 lATQKVKEFLEPQGLYiraDPTPWYKAMWRlARTCHYVESNEGVQYFK 420 



SEQUENZPROTOKOLL 

<110> BASF Plant Science GmbH 



<120> Verfahren zur Expression von Biosynthesegenen. in 
pflanzlichen Samen unter Verwendung von heuen 
multiplene Expressionskonstrukten 

<130> 2000^904 

<140> 2000_904 
<141> 2000-12-22 

<160> 35 

<170> Patentin Vers. 2.0 

<210> 1 
<211> 1652 
<212> DNA 

<213> Phaeodactylum tricomutum 

<220> 

<221> CDS 

<222> (115) . . (1524) 
<400> 1 

gacccaacaa acccaacaat cccaacaatc ccatcaacag gaattgggtt tcgttgagtc 60 

aataattgct agaatccaaa cagacagaca gagaccaacc gcatctatta caga atg 117 . 

Met 
1 

get cog gat gcg gat aag ctt cga caa cgc cag acg act gcg gta gcg 165 
Ala Pro Asp Ala Asp Lys Leu Arg Gin Arg Gin Thr Thr Ala Val Ala 
5 10 15 

aag cac aat get get aec ata teg acg cag gaa cgc ctt tge agt ctg ' 213 
Lys His Asn Ala Ala Thr lie Ser Thr Gin Glu Arg Leu Cys Ser Leu 
20 25 30 

tct teg etc aaa ggc gaa gaa gtc tgc ate gae gga ate ate tat gac 261 
Ser Ser Leu Lys Gly Glu Glu Val Cys lie Asp Gly lie lie Tyr Asp 
35 40 45 

etc caa tea ttc gat cat cec ggg ggt gaa acg ate aaa atg ttt ggt 3 09 
Leu Gin Ser Phe Asp His Pro Gly Gly Glu Thr He Lys Met Phe Gly 
50 55 60 65 

ggc aac gat gtc act gta cag tac aag atg att cac ecg tac cat ace 357 
Gly Asn Asp Val Thr Val Gin Tyr Lys Met He His Pro Tyr His Thr 
70 75 80 

gag aag cat ttg gaa aag atg aag cgt gtc ggc aag gtg acg gat ttc 405 
Glu Lys His Leu Glu Lys Met Lys Arg Val Gly Lys Val Thr Asp Phe 
85 90 95 

gtc tgc gag tac aag ttc gat acc gaa ttt gaa cgc gaa ate aaa cga 453 



Val Cys Glu Tyr hys Phe Asp Thr Glu Phe Glu Arg "Glu lie Lys Arg 
100 105 110 

gaa gtc ttc aag att gtg cga cga ggc aag gat ttc ggt act ttg gga 501 
Glu Val Phe Lys lie Val Arg Arg Gly Lys Asp Phe Gly Thr Leu Gly 
115 120 125 

tgg ttc ttc cgt gcg ttt tgc tac att gcc att ttc ttc tac ctg cag 549 
Trp Phe Phe Arg Ala Phe Cys Tyr He Ala He Phe Phe Tyr Leu Gin 
130 135 140 * , * 145. 

tac cat tgg gtc acc acg gga acc tct tgg ctg ctg gcc gtg gcc tac 597 
Tyr His Trp Val Thr Thr Gly Thr Ser Trp Leu Leu Ala Val Ala Tyr 
150 • 155 ' 160 

gga ate tec caa gcg atg att ggc atg aat gtc cag cac gat gcc aac "645 
Gly Hp Ser Gin Ala Met He Gly Met Asn Val Gin His Asp Ala Asn 
165 170 175 

cac ggg gcc acc tec aag cgt ccc tgg gtc aac gac atg cfta ggc etc * 693 
His Gly Ala Thr Ser Lys Arg Pro Trp Val Asn Asp Met Leu Gly Leu . 
180 ' 185 190 

ggt gcg gat ttt att ggt ggt tec aag tgg etc tgg cag gaa caa cac 741 
Gly Ala Asp Phe He Gly Gly Ser Lys Trp Leu Trp Gin Glu Gin His 
•195 * . 200 205 

tgg acc cac cac get tac acc aat cac gcc gag atg gat ccc gat age 789 
Trp Thr His His Ala Tyr Thr Asn His Ala Glu Met Asp Pro Asp Ser 

210 215 220 225 

ttt ggt gcc gaa cea atg etc eta ttc aac gac tat ccc ttg gat cat • 837 . 
Phe Gly Ala- Glu Pro Met Leu Leu Phe Asn Asp Tyr Pro Leu Asp His 
230, 235 240- 

ccc get cgt acc tgg eta cat cgc ttt caa gca ttc ttt tac atg ccc 885 
Pro Ala Arg Thr Trp Leu His Arg Phe Gin Ala Phe Phe Tyr Met Pro 
245 250 255 

gtc ttg get gga tac tgg ttg tec get gtc ttc aat cca caa att ctt 933 
Val Leu Ala Gly Ty^^ Trp Leu Ser Ala Val Phe Asn Pro Gin He Leu . 
260 265 270 

gac etc cag caa cgc ggc gca ctt tec gtc ggt ate cgt etc gac aac 981 
Asp Leu Gin Gin Arg Gly Ala Leu Ser Val Gly He Arg Leu Asp Asn 
275 280 285 

get ttc att cac teg cga cgc aag tat gcg gtt ttc tgg egg get gtg 1029 
Ala Phe He His Ser Arg Arg Lys Tyr Ala Val Phe Trp Arg Ala Val 
290 295 30a 305 

tac att gcg gtg aac gtg att get ccg ttt tac aca aac tec ggc etc 1077 
Tyr He Ala Val Asn Val He* Ala Pro Phe Tyr Thr Asn Ser Gly Leu 
310 315 320 

gaa tgg tec tgg cgt gtc ttt gga aac ate atg etc atg ggt gtg gcg 1125 
Glu Trp Ser Trp Arg Val Phe Gly Asn He Met Leu Met Gly Val Ala 
325 330 335 
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gaa teg etc gcg ctg gcg gtc ctg ttt teg ttg teg cae aat ttc gaa 1173 
Glu Ser Leu Ala Leu Ala Val; Leu Phe Ser Leu Ser His Asn Phe Glu 
340 345 350 

tec gcg gat cgc gat ccg aec gee eca ctg aaa aag acg gga gaa eca 1221 
Ser Ala Asp Arg Asp Pro Thr Ala Pro Leu Lys Lys Thr Gly Glu Pro 
355 . 360 365 

gtc gac tgg ttc aag aca cag gtc gaa act tec tgc act tac ggt gga 1269 
Val Asp Tip Phe Lys Thr Gin Val Glu Thr Ser Cys Thr Tyr Gly Gly 
370 . 375 380 * 385 

ttc ctt tec ggt tgc ttc acg gga ggt etc aac ttt cag gtt.gaa eac 1317 
Phe Leu Ser Gly Cys Phe Thr Gly Gly Leu Asn Phe Gin Val Glu His 
390 395 400 

eac ttg ttc eca cgc atg age age get tgg tat cec tac att gee ecc 1365 
His Leu Phe Pro Arg Met Ser Ser Ala Trp Tyr Pro Tyr lie Ala Pro 
405 -410 415 

aag gtc cgc gaa att tgc gee aaa eac ggc gtc eac tac gcc tac tac .1413 
Lys Val Arg Glu lie Cys Ala Lys His Gly Val. His Tyr Ala Tyr Tyr 
420 425 430 

ccg tgg ate eac caa aac ttt etc tec aec gtc cgc tac atg eac gcg 1461 
Pro Trp lie His Gin Asn Phe Leu Ser Thr Val Arg Tyr. Met His Ala 
435 440 445 

gcc ggg aec ggt gcc aac tgg cgc cag atg gcc aga gaa. aat ecc ttg 1509 
Ala Gly Thr Gly Ala Asn Trp Arg Gin Met Ala Arg Glu Asn Pro Leu 
450 455 460 465 

ace gga qgg gcg taa aagtacacga cacgaccaaa ggtggcgtat ggtgatctct 1564 
Thr Gly Arg Ala 

470 • 

agaaaacaga catagcetac tggaaatate gaegtccaaa caataatttt aaagactatt 1624 
tttctgcgta aaaaaaaaaa aaaa,aaaa 1652 



<210> 2 
<211> 469 
<212> PRT 

<213> PhaeodactyJum tricomutum 
<400> 2 J . • 

Met Ala Pro Asp Ala Asp Lys Leu Arg Gin Arg Gin Thr Thr Ala Val 
1 5 .10 15 

Ala Lys His Asn Ala Ala Thr lie Ser Thr Gin Glu Arg Leu Cys Ser 
20 25 30 

Leu Ser Ser Leu Lys Gly Glu Glu Val Cys lie Asp Gly lie He Tyr 
35 40 45 



Asp Leu Gin Ser Phe Asp His Pro Gly Gly Glu Thr He Lys Met Phe 



50 



55 



60' 



Gly Gly Asn Asp Val Thr Veil Gin Tyr Lys Met lie His Pro Tyr.His 
65 70 .75 80 

Thr Glu Lys His Leu Glu Lys Met Lys Arg Val Gly Lys Val Thr' Asp 
85 . 90 95 

Phe Val Cys Glu T?yr Lys Phe Asp Thr Glu Phe Glu Arg Glu lie Lys 
100 105 110 

Arg Glu Val Phe Lys lie Val Arg Arg Gly Lys Asp Phe Gly Thr Leu 
115 120 .125 

Gly Trp Phe Phe Arg Ala Phe Cys Tyr lie Ala He Phe ?he Tyr Leu 
130 • 135 140 

Gin Tyr His Trp Val Thr Thr Gly Thr Ser Trp Leu Leu Ala Val Ala 
145 150 . . 155 160 

Tyr Gly He Ser Gin Ala Met He Gly Met Aisn Val Gin His Asp Ala 
165 170 . ' 175 

Asn His Gly Ala Thr Ser Lys Arg Pro Trp Val Asn Asp Met Leu Gly 
180 185 190 

Leu Gly Ala Asp Phe He Gly Gly Ser Lys Trp Leu Trp Gin Glu Gin 
195 200 205 ' 

His Trp Thr His His Ala Tyr Thr Asn His Ala Glu Met Asp Pro Asp 
210 215 220 

Ser Phe Gly Ala Glu Pro Met Leu Leu Phe Asn Asp Tyr Pro Leu Asp 
225 230 235 240 

His Pro Ala Arg Thr Trp Leu His Arg Phe Gin Ala Phe Phe Tyr Met 
245 250 255 

Pro Val Leu Ala Gly Tyr Trp Leu Ser Ala Val Phe Asn Pro Gin He 
260 265' 270 

Leu Asp Leu Gin Gin Arg Gly Ala Leu Ser Val Gly He Arg Leu Asp 
275 280 . 285 

Asn Ala Phe He His Ser Arg Arg Lys Tyr Ala Val Phe Trp Arg Ala 

290 295 300 

Val Tyr He Ala Val Asn Val He Ala Pro Phe Tyr Thr Asn Ser Gly 
305 310 315 ' 320 

Leu Glu Trp Ser Trp Arg Val Phe Gly Asn He Met Leu Met Gly Val 
325 330 335 

Ala Glu Ser Leu Ala Leu Ala Val Leu Phe Ser Leu' Ser His Asn Phe 
340 345 350 



Glu Ser Ala Asp Arg Asp Pro Thr Ala Pro Leu Lys Lys Thr Gly Glu 
355 360 365 
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Pro Val Asp Trp Phe Lys Thr Gin Val Glu Thr Ser Cys Thr Tyr Gly 
370 375 - 380 

Gly Phe Leu Ser Gly Cys Phe Thr Gly Gly Leu Asn Phe Gin Val Glu 
385 390 395 400 

His His Leu Phe Pro Arg Met Ser Ser Ala Trp Ty^ Pro oyr lie Ala 
405 410 415 

Pro Lys Val Arg Glu lie Cys Ala Lys His Gly Val His Tyr Ala Tyr 
420 425 430 

Tyr Pro Trp lie His Gin Asn Phe Leu Ser Thr Val Arg Tyr Met His 
. 435 440 445 

Ala Ala Gly Thr Gly Ala Asn Trp Arg Gin Met Ala Arg Glu Asn Pro 
450 455 \ 46a 

Leu Thr Gly Arg Ala 
465 



<210> 3 
<211> 1434 . 
<212> DNA 

<213> Phaeodactylum tricomutum 

<220> 

<221> CDS 

<222> (1)..(1434) 

<400> 3* 

atg ggc aaa gga ggg gac get egg gcc teg aag ggc tea acg gcg get 48 
Met Gly Lys Gly Gly Asp Ala Arg Ala Ser Lys Gly Ser Thr Ala Ala 
1 . 5 • . ' . 10 . 15 

cgc aag ate agt tgg cag gaa gtc aag ace cac geg tct c eg gag gac 96 
Arg Lys He Ser Trp Gin Glu Val Lys Thr His Ala Ser Pro Glu Asp 
20 25 30 

gcc tgg ate att cac tec aat aag gtc tac gac gtg tec aac tgg cac - 144 
Ala Trp He He His Ser Asn Lys Val Tyr Asp Val Ser Asn Trp His 
35 40 45 

gaa cat ccc gga ggc gcc gtc att ttc acg cac gcc ggt gac gac atg 192. 
Glu His Pro Gly Gly Ala Val He Phe Thr His Ala Gly Asp Asp Met 
50 55 60 . . 

acg gac att ttc get gcc ttt cac gca ccc gga teg cag teg etc atg 240 
Thr Asp He Phe Ala Ala Phe His Ala Pro Gly .Ser Gin Ser Leu Met 
65 70 .75 . 80 

aag aag ttc tac att ggc gaa ttg cte ccg gaa ace ace ggc aag gag 288 
Lys Lys Phe Tyr He Gly Glu Leu Leu Pro Glu Thr Thr Gly Lys Glu 
85 90 95 

ceg cag eaa ate gcc ttt gaa aag ggc tac cgc gat ctg cgc tee aaa 336 
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Pro Gin Gin lie Ala Phe Glu Lys Gly Tyr Arg Asp Leu Arg Ser Lys 
100 105 110 

etc ate atg atg ggc atg ttc aag tec aac aag tgg ttc tac gtc tac 
Leu lie Met Met Gly Met Phe Lys Ser Asn Lys Trp Phe Tyr Val Tyr 
115 120 125 



384 



aag tgc etc age aac atg gee att tgg gee gee gee tgt get etc gte 432 
Lys Cys Leu Ser Asn Met Ala lie Trp Ala Ala Ala Cys Ala Leu Val 
130 135 140 

ttt tac teg gae cgc ttc tgg gta cac ctg gee age gee gtc atg ctg 480 
Phe Tyr Ser Asp Arg Phe trp Val His Leu Ala Ser Ala Val Met Leu 
145 150 155 160 

gga aea ttc ttt eag eag teg gga tgg ttg gea cac gac ttt ctg cac 528 
Gly Thr Phe Phe Gin Gin Ser Gly Trp Leu Ala His Asp Phe Leu His 
165 170 175 

cac cag gtc ttc acc aag cgc aag cac ggg gat etc gga gga etc ttt 576 
His Gin Val Phe Thr Lys Arg Lys His Gly Asp Leu Gly Gly Leu Phe 
180 185 190 

tgg ggg aac etc atg eag ggt tac tee gta eag tgg tgg aaa aac aag 624 
Trp Gly Asn Leu Met Gin Gly Tyr Ser Val Gin Trp Trp Lys Asn Lys 
195 2.00 205 

cac . aac gga cac cac gcc gtc ccc aac etc cac tgc tec tec gea gtc 672 . 
His Asn Gly His His Ala Val Pro. Asn Leu His Cys Ser Ser Ala Val 
210 ' 215 . . 220 ' . . 

geg caa gat ggg gac ecg gac ate gat ace atg ccc ett etc gee tgg 720 

Ala Gin Asp Gly Asp Pro Asp lie Asp Thr Met Pro Leu Leu Ala Trp 

225 230 235 240 , \ 

tec gtc cag caa gcc cag tct tac egg gaa etc caa gcc gac gga aag 768 
Ser Val Gin Gin Ala Gin Ser Tyr Arg Glu Leu Gin Ala Asp Gly Lys 
.245 250 255 

gat teg ggt ttg gtc aag ttc atg ate cgt aac caa tec tjsie ttt tac 816 
Asp Ser Gly Leu Val Lys Phe Met lie Arg Asn Gin Ser Tyr Phe Tyr 
260 265 270 

. ttt ccc ate ttg ttg etc gcc cgc ctg teg tgg ttg aac gag tec ttc 864 - 
Phe Pro lie Leu Leu Leii Ala Arg Leu Ser. Trp Leu Asn Glu Ser Phe 
275 280 285 

aag tgc gee ttt ggg ett gga get geg teg gag aac get get etc gaa 912 
Lys Cys Ala Phe Gly Leu Gly Ala Ala Ser Glu Asn Ala Ala Leu Glu 
290 * 295 300 

etc aag gcc aag ggt ett cag tac ccc ett ttg gaa aag get ggc ate 960 
Leu Lys Ala Lys Gly Leu Gin Tyr Pro Leu Leu Glu Lys Ala Gly lie 
305 310 315 * 320 

ctg ctg cac tac. get tgg atg ett aea gtt teg tec ggc ttt gga cgc 1008 
Leu Leu His Tyr Ala Trp Met Leu Thr Val Ser Ser Gly Phe Gly Arg 
325 • 330 335 
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ttc teg ttc gcg tac acc gca ttt tac ttt eta acc gcg acc gcg tec 1056 
Phe Ser Phe Ala Tyr Thr Ala Phe Tyr Phe Leu Thr Ala Thx Ala Ser 
340 345 350 

tgt gga ttc ttg etc gee att gtc ttt ggc etc ggc cae aac ggc atg 1104 
Cys Gly Phe Leu Leu Ala lie Val Phe Gly Leu Gly His Asn Gly Met 
355 ' 360 365 

gee acc tac aat gee gae gee egt ecg gae ttc tgg aag etc caa gtc 1152 
Ala Thr Tyr Asn Ala Asp Ala Arg Pro Asp Phe Trp Lys Leu Gin Val 
370 375 * 380 



acc aeg act cge aac gtc aeg ggc gga cae ggt ttc ecc caa gee ttt 1200 
Thr Thr J. Thr Arg Asn Val Thr Gly Gly His Gly Phe Pro Gin Ala Phe 
385 390 395 400 

gtc gae tgg ttc tgt ggt ggc etc cag tac caa gtc gae cae cae tta 1248 
Val Asp Trp Phe Cys Gly Gly Leu Gin Tyr Gin Val Asp His His Leu ' 
405 ■ 410 415 

ttc ecc age ctg cec ega cae aat ctg gee aag aca cae gca etg gtc 1296 
Phe Pro Ser Leu Pro Arg His Asn Leu Ala Lys Thr His ' Ala Leu Val 
420 ' ^ 425 ' 430 

gaa teg ttc tgc aag gag tgg ggt gtc cag tac cac gaa gee gae ett 1344 
Glu Ser Phe Cys Lys Glu Trp Gly Val Gin Tyr His Glu Ala Asp Leu 
435 440 445 

gtg gae ggg acc atg gaa gtc ttg cac eat ttg ggc age gtg gee ggc 1392 
Val Asp Gly Thr Met Glu Val Leu His His Leu Gly Ser Val Ala Gly 
450 455 460 

gaa ttc gtc gtg gat ttt gta cgc gat gga ecc gcc atg taa 1434 
Glu Phe Val Val Asp Phe Val Arg Asp Gly Pro Ala Met 
465 470 475 

<210> 4 
<211> 477 
<212> PRT 

<213> Phaeodactylum tricomutum 
<400> 4 

Met Gly. Lys Gly Gly Asp Ala Arg Ala Ser Lys Gly Ser Thr Ala Ala 

1 5 .10 • 15 ' ^ 

Arg Lys lie Ser Trp Gin Glu Val Lys Thr His Ala Ser Pro Glu Asp 
20 25 30 

Ala Trp lie lie His Ser Asn Lys Val Tyr Asp Val Ser Asn Trp His 
35 40 . 45 ' 

Glu His Pro Gly Gly Ala Val lie Phe Thr His Ala Gly Asp Asp Met 
50 55 60 



Thr Asp He Phe Ala Ala Phe His Ala Pro Gly Ser Gin Ser Leu Met 
65 70 75 80 
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Lys Lys Phe Tyr lie Gly Glu Leu Leu Pro Glu Thr Thr Gly Lys Glu 
85 90 95 

Pro Gin Gin lie Ala Phe Glu Lys Gly Tyr Arg Asp Leu Arg Ser Lys 
100 105 110 

Leu lie Met Met Gly Met Phe Lys Ser Asn Lys Trp Phe Tyr Val Tyr 
115 120 125 

Lys Cys Leu Ser Asn Met Ala lie Trp Ala Ala Ala Cys Ala Leu Val 
130 ' 135 140 

iphe Tyr Ser Asp Arg Phe Trp Val His Leu Ala Ser Ala Val Met Leu 
145 150 155 160 

Gly Thr Phe Phe Gin Gin Ser Gly Trp Leu Ala His- Asp Phe Leu His 
165 • 170 175 

His Gin Val Phe Thr Lys- Arg Lys His Gly Asp Leu . Gly Gly Leu Phe 
180 185 190 

Trp Gly Asn Leu Met Gin Gly Tyr Ser Val Gin Trp Trp Lys Asn Lys 
195 200 205 

His Asn Gly His His Ala Val P^o Asn Leu His Cys Ser Ser Ala Val 
210 215 - 220 . 

Ala Gin Asp Gly Asp Pro Asp He Asp Thr Met Pro Leu Leu Ala Trp 
225 230 235 240 

Ser Val Gin Gin Ala Gin Ser "Tyr Arg Glu Leu Gin Ala Asp Gly Lys 
245 250 255 

Asp Ser Gly Leu Val Lys Phe Met He Arg Asn Gin Ser Tyr Phe Tyr 
260 265 -270 

Phe Pro He Leu Leu Leu Ala Arg Leu Ser Trp Leu Asn Glu Ser Phe 
275 280 285 . 

Lys Cys Ala Phe Gly Leu Gly Ala Ala Ser Glu Asn Ala Ala. Leu Glu 
290 295 300 

Leu Lys Ala Lys Gly Leu Gin Tyr Pro Leu Leu Glu Lys Ala Gly He 
30.5 310 315 320 

Leu Leu His Tyr Ala Trp Met- Leu Thr Val Ser Ser Gly Phe Gly Arg 
325 330 335 

Phe Ser Phe Ala Tyr Thr Ala Phe Tyr Phe Leu Thr Ala Thr Ala Ser 
340 345 350 

Cys Gly Phe Leu Leu Ala He Val Phe Gly Leu Gly His Asn Gly Met 
355 360 365 



Ala Thr Tyr Asn Ala Asp Ala Arg Pro Asp Phe Trp Lys Leu Gin Val 
370 375 380 
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Thr Thr Thr Arg Asn Val Thr Gly Gly His Gly Phe Pro Gin Ala Phe 
385 390 395 400 

Val Asp Trp Phe Cys Gly Gly Leu Gin Tyr Gin Val Asp His His Leu 
405 410 415 

Phe Pro Ser Leu Pro Arg His Asn Leu Ala Lys Thr His Ala Leu Val 
420 • 425 430 

Glu Ser Phe Cys Lys Glu Trp Gly Val Gin Tyr His Glu Ala Asp Leu 
435 440 445 

Val Asp Gly Thr Met Glu Val Leu His His Leu Gly Ser Val Ala Gly 
450 455 460 



Glu Phe Val Val Asp Phe Val Arg Asp Gly Pro Ala Met 
465 470 475 



<210> 5 
<211> 1651 
<212>*DNA 

<213> Phaeodactylum tricbmutum 

<220>- 

<221> CDS 

<222> (67).. (1554) 

<400> 5 

gaagaaggaa catataaaag taagccatct cctcggcacc atctaaagac ctaatatcta 60 

ctcgtc atg gtt cgc ttt tea aca gcc get eta ctt tct ctg teg aca 108 
Met Val Arg Phe Ser Thr Ala Ala Leu Leu Ser Leu Ser Thr 
1 . 5 . 10 

ttg aca act tea tgt att ggt gee tte cag ctg tct teg cca gca caa 156 
Leu Thr Thr Ser Cys lie Gly Ala Phe Gin Leu Ser Ser Pro Ala Gin 
15 . 20 ' 25 30 . 

ett ccg aea agt agg ett egt egg eat aeg aae aeg gcg eeg ctt teg 204 
Leu Pro Thr' Ser Arg Leu Arg Arg His Thr Asn Thr Ala Pro Leu Ser 
35 40 45 

gcc gtg gcc gtc gac tec ggt tct tec gat ccg gee ttg gta ggc aac 252 
Ala Val Ala Val Asp Ser Gly Ser Ser Asp Pro Ala Leu Val Gly Asn 
50 55 60 

etc ccc ctt ccc aac aac aat gat aat gag gac aag aae egt aga atg 300 
Leu Pro Leu Pro Ash Asn Asn Asp Asn Glu Asp Lys Asn Arg Arg Met 
65 70 75 

cca atg atg gac ttg aaa ggt att get ctg tct ggt etc aaa ggg caa 348 
Pro Met Met Asp Leu Lys Gly lie Ala Leu Ser Gly Leu Lys Gly Gin 
80 85 90 

get ctt tec gtc cga" gcg gaa gat ttt cet cag gcg aaa gac ttg egt 396 
Ala Leu Ser Val Arg Ala Glu Asp Phe Pro Gin Ala Lys Asp Leu Arg 
95 100 105 110 
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gcc gtc att ccg aaa gat tgc ttc gaa ccc gac acg gcc aaa teg ttg 444 
Ala Val lie Pro Lys Asp Cys Phe Glu Pro Asp Thr Ala Lys Ser Leu 
115 120 125 

gga tat ctt tec gtt tea aet atg ggg aca att cte tgc tec gtc gtc 492 
Gly Tyr Leu Ser Val Ser Thr Met Gly Thr lie Leu Cys Ser Val Val 
130 135 140 

ggc gcg aac etc ctt agt gtg etc gat ccc tec aat cca tta ace tgg 540 
Gly Ala Asn Leu Leu Ser Val Leu Asp Pro Ser Asn Pro Leu Thr Trp 
145 150 155 

ect etc tgg gcg gee tac ggt gcc gtc acg ggg acg gtc gee atg ggg 588 
Pro Leu Trp Ala Ala Tyr Gly Ala Val Thr Gly Thr Val Ala Met Gly 
160 165 170 

ctt tgg. gtg ctg gcc cac gaa tgc gga cac ggc gcc ttt tec aaa aac 636 
Leu Trp Val Leu Ala His Glu Cys Gly His Gly Ala Phe Ser Lys Asn 
175 180 185 • 190 

cga tec etc cag gat gcc gtg ggg tac att ate cat tec ate atg ctg 684 
Arg Ser Leu Gin Asp Ala Val Gly Tyr lie lie His Ser lie Met Leu 
195 200 205 

gtg cca tac ttt agt tgg cag cga teg cat gcc gtg cat cac cag tat 732 
Val Pro Tyr Phe Ser Txp Gin Arg Ser His Ala Val His His Gin Tyr 
• 210 215 220 

ace aat cat atg gaa ctg ggg gaa aca cac gtt ect gat cga gcc gat 780 
Thr Asn His Met Glu Leu Gly Glu Thr His Val Pro Asp Arg Ala Asp 
225 230 235 

aag gag ggc gag aag age ctg gcg etc cgc cag ttc atg ttg gat tec 828 
Lys Glu Gly Glu Lys . Ser Leu Ala Leu Arg Gin Phe Met Leu Asp Ser 
240 245 250 

ttt ggt aaa gac aag ggc atg- aaa gca tac gga ggc etc cag teg ttt 876 
Phe Gly Lys Asp Lys Gly Met Lys Ala Tyr Gly Gly Leu Gin Ser Phe 
255 260 265 270 . 

ttg eat etc ate gtg gga tgg cca gcc tac etc ctg ate ggt gcg ace 924 
Leu His Leu lie Val .Gly Trp Pro Ala Tyr Leu Leu lie Gly Ala Thr 
275 280 285 

ggt gga ccc gac egt ggt atg ace aac cat ttt tat ccc aac ect ttg. 972 
Gly Gly Pro Asp Arg Gly Mfet Thr Asn His Phe Tyr Pro Asn Pro Leu 
290 295 300 

teg acg cca aca cag ccc aag aaa gaa ctt ttc ect ggg aac tgg aaa 1020 
Ser Thr Pro Thr Gin Pro Lys Lys Glu Leu Phe Pro Gly Asn Trp Lys 
305 310 315 

gaa aag gtc tac cag tea gat att gga ate gee gee gtt gtc ggc gcc 1068 
Glu Lys Val Tyr Gin Ser Asp lie Gly lie Ala Ala Val Val Gly Ala 
320 325 330 

etc att get tgg ace gcc act teg ggt eta gcc ccc gtc atg gcc ttg 1116 
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Leu lie Ala Trp Thr Ala Thx Ser Gly Leu Ala Pro Val Met Ala Leu 
335 340 345 350 

tac ggt ggt ccc ttg ate gtc att aat gcc tgg ctg gta ctg tac acg 1164 
Tyr Gly Gly Pro Leu lie Val lie Asn Ala Trp Leu Val Leu Tyr Thr 
355 360 365 

tgg ttg caa cat aca gat acc gat gtt ccg cac ttt tec tec gae aac 1212 
Trp Leu Gin His Thr Asp Thr Asp Val Pro His Phe Ser Ser Asp Asn 
370 . 375 380 

cac aac ttt gtc aag ggc gca ctg cat acg ate gat cgt ccc tac gae 1260 
His Asn Phe Val Lys Gly Ala Leu His Thr He Asp Arg Pro Tyr Asp 
385 390 * 395 

aaa ett gat ccc tgg gga ate ata gae ttt ctg cac cac aag att gga 1308 
Lys Leu Asp Pro -Trp Gly He He Asp Phe Leu His His Lys He Gly 
400 405 ^ 410 

aca acg cat gtg gca cac cat ttt gae agt act ate ccc cac tat aag ' 1356 
Thr Thr His Val Ala His His Phe Asp Ser Thr He Pro His Tyr Lys 
415 ■ ' '420 425 430 

get cag att. get acc gat gcc ate aaa gcc aag ttt cca gaa gtg tac 1404 
Ala. Gin He Ala Thr Asp Ala He Lys Ala Lys Phe Pro Glu Val Tyr 
435 440 445 

etc tat gae ccg aca cca att cca caa gcc atg tgg cge gtc gcc aag 1452 
Leu Tyr Asp Pro Thr Pro He Pro Gin Ala Met .Trp Arg Val Ala Lys 
450 . ~ i 455 460 

gga tgt act gca gta gag .caa cge ggt gae gcc tgg gtg tgg aaa aac 1500 
Gly Cys Thr Ala Val Glu Gin Arg Gly Asp Ala Trp Val* Trp Lys Asn 
.465 470 ■ 475 

gaa gga ata gaa gat ttg gtg gaa cat cgt caa age aaa tta teg age 1548 
Glu Gly He Glu Asp Leu Val Glu His Arg Gin Ser Lys Leu Ser Ser 
480 . . 485 490 

gaa taa agcaacatat cgctttatgg aagaaeaaac gtccattgtg taaaaccctg 1^9^^ 
Glu 

495 ..' 

ataatttcaa tattgtgttt tgttttaaaa aaaaaaaaaa aaaaaaa 1651 



<210> 6 

<211> 495 , 
<212> PUT 

<213> Phaeodactyltim tricomutuia 
<400> 6 

Met Val Arg Phe Ser Thr Ala Ala Leu Leu Ser Leu Ser Thr Leu Thr 
1 5 ' * 10 15 



Thr Ser Cys He Gly Ala Phe Gin Leu Ser Ser Pro Ala Gin Leu Pro 
20 25 30 
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Thr Ser Arg Leu Arg Arg His Thr Asn Thr Ala Pro Leu Ser Ala Val 
35 40 45 

Ala Val Asp Ser Gly Ser Ser Asp Pro Ala Leu Val Gly Asn Leu Pro 
50 55 60 

Leu Pro Asn Asn Asn Asp Asn Glu Asp Lys Asn Arg Arg Met Pro Met 
65 70 75 80 

Met Asp Leu Lys Gly He Ala Leu Ser Gly Leu Lys Gly Gin Ala Leu 
85 90 . 95 

Ser Val Arg Ala Glu Asp Phe Pro Gin Ala Lys Asp Leu Arg Ala Val 
100 . 105 110 

lie Pro Lys Asp Cys Phe Glu Pro Asp Thr Ala Lys Ser Leu Gly Tyr 
115 • . 120 125 

Leu Ser Val Ser Thr Met Gly Thr He Leu Cys Ser Val Val Gly Ala 
130 135 140 

Asn Leu Leu Ser Val Leu Asp Pro Ser Asn Pro Leu Thr Trp Pro Leu 
145 150 155 * • • 160 

Trp Ala Ala Tyr Gly Ala Val -Thr Gly Thr Val Ala Met' Gly Leu Trp 
165 170 175 

Val Leu Ala His Glu Cys Gly His Gly Ala Phe Ser Lys Asn Arg Ser 
180 . ' • . 185 * 190 

Leu Gin Asp Ala Val Gly Tyr He He His Ser He Met Leu Val Pro 
195 200 205 

Tyr Phe Ser Trp Gin Arg Ser His Ala Val His His Gin Tyx Thr Asn 
210 ■ 215 220 

His Met Glu Leu Gly Glu Thr His Val Pro Asp Arg Ala Asp* Lys Glu 
225 .230 235 .240 

Gly Glu Lys Ser Leu Ala Leu Arg Gin Phe Met Leu Asp Ser Phe Gly 
245 250 255. 

Lys Asp Lys Gly Met Lys Ala Tyr Gly Gly Leu Gin Ser Phe Leu His 
260 265 270 

Leu He Val Gly Trp Pro Ala Tyr Leu Leu He Gly Ala Thr Gly Gly 
275 280 285 

Pro Asp Arg Gly Met Thr Asn His Phe Tyr Pro Asn Pro Leu Ser Thr 
290 295 300 

Pro Thr Gin Pro Lys Lys Glu Leu Phe Pro Gly Asn Trp Lys Glu Lys 
305 310 315 320 



Val Tyr Gin Ser Asp He. Gly He Ala Ala Val Val Gly Ala Leu He 
325 330 335 



Ala Trp Thr Ala Thr Ser Gly Leu Ala Pro Val Met Ala Leu Ty^ Gly 
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345 



Gly Pro Leu lie Val lie Asn Ala Trp Leu Val Leu Tyr Thr Trp Leu 
355 360 365 

Gin His Thr Asp Thr Asp Val Pro His Phe .Ser Ser Asp Asn His Asn 
370 375 380 

Phe Val Lys Gly Ala Leu His Thr lie Asp Arg'Pro Tyr Asp Lys Leu 
■385 ■ 390 395 400 

Asp Pro Trp Gly He He Asp Phe Leu His His Lys He Gly Thr Thr 
405 410 415 . 

His Val Ala His His Phe Asp Ser Thr He Pro His Tyr Lys Ala Gin 
420 . 425 430 

He Ala Thr Asp Ala He Lys Ala Lys Phe Pro Glu Val .Tyr Leu Tyr 
435 440 445 

Asp Pro Thr Pro He Pro Glii Ala Met Trp Arg Val Ala Lys Gly Cys 
450 ; 455 460 

Thr Ala Val Glu Gin Arg Gly Asp Ala Trp Val Trp Lys Asn Glu Gly 
465 470 475 480 

He Glu Asp Leu Val Glu His Arg Gin Ser Lys Leu Ser Ser Glu 
485 490 495 ' 



<210> 7 
<211> 1578 
<212> DNA 

<213> Physcomitrella patens . . 

<220> 

<221> CDS 

<222> (1) . . (1578) 

<400> 7 . 

atg gta ttc gcg ggc ggt gga ctt cag cag ggc tct etc gaa gaa aac 48 

Met Val Phe Ala Gly Gly Gly Leu Gin Gin Gly Ser Leu Glu Glu Asn 
1 • 5 10 . 15 

ate gac gtc gag cac att gcc agt atg tct etc ttq age gae ttc ttc 96 
He Asp Val Glu His He Ala Ser Met Ser Leu Phe Ser Asp Phe Phe 
20 . 25 .30 

agt tat gtg tct tea act gtt ggt teg tgg age gta cac agt ata caa 144 
Ser Tyr Val Ser Ser Thr Val Gly Ser Trp Ser Val His Ser He Gin 
35 40 '45 

ect ttg aag egc ctg aeg agt aag aag egt gtt teg gaa age get gee 192 
Pro Leu Lys Arg Leu Thr Ser Lys Lys Arg Val Ser Glu Ser Ala Ala 
50 55 60 

gtg caa tgt ata tea get gaa gtt cag aga aat teg agt acc cag gga 240 
Val Gin Cys He Ser Ala Glu Val Gin Arg Asn Ser Ser Thr Gin Gly 
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65 










70 




75 








80 


act 
Thr 


gcg 

Ala 


gag 
Glu 


gca 
Ala 


etc 
Leu 
85 


gca 
Ala 


gaa tea gte 
Glu Ser Val 


gtg aag 
Val Lys 
90 


ecc 
Pro 


aeg 
Thr 


aga cga 
Arg Arg 
95 


agg 
Arg 


tea 
Ser 


tct 
Ser 


cag 
Gin 


tgg 
Trp 
100 


aag 
Lys 


aag 
Lys 


teg aca cac 
Ser Thr His 
105 


ecc eta 
Pro Leu 


tea 
Ser 


gaa 
Glu 


gta gca 
Val Ala 
110 


gta 
Val 


cae 
His 


aac 
Asn 


aag 
Lys 
115 


cea 
Pro 


age 
Ser 


gat 
l^p 


tgc tgg att 
Cys Trp He 
120 


gtt gta 
Val Val 


aaa 
Lys 


aac 
Asn 
125 


aag gtg 
Lys Val 


4- a 4* 

tat 
Tyr" 


gat 
Asp 


gtt 
Val 
130 


tec 
Ser 


aat 
Asn 


ttt 
Phe 


gcg 

Ala 


gae gag eat 
Asp Glu His 
135 


ecc gga 
Pro Gly 


gga 
Gly 
140 


tea 
Ser 


gtt att 
Val He 


agt 
Ser 


act 
Thr 
145 


tat 
Tyr 


ttt 
Phe 


gga 

Gly 


cga 
Arg 


gae 
Asp 
150 


ggc aca gat 
Gly Thr Asp 


gtt ttc 
Val • Phe 
155 


tct 
Ser 


agt 
Ser 


ttt cat 
Phe His 


gca 
Ala 
160 


get 
Ala 


tct 
Ser 


aea 
Thr 


tgg 
Trp 


aaa 
Lys 
165 


att 
He 


ctt caa gae 
Leu Gin Asp 


ttt tac 
Phe Tyr 
170 


att 
He 


ggt 

Gly 


gae gtg 
Asp Val 
175 


gag 
Glu 


agg 
Arg 


gtg 
Val 


gag 
Glu 


ecg 
Pro 
180 


act 
Thr, 


cea 
Pro 


gag ctg ctg. 
Glu Leu Leu 
185 


aaa gat 
Lys Asp 


ttc 
Phe 


ega 
Arg 


gaa atg 
Glu Met 
190 


aga 
Arg 


^ct 
Ala 


ctt 
Leu 


ttc 
Phe 
195 


ctg 
Leu 


agg 
Arg 


gag 
Glu 


caa ctt ttc 
Gin Leu Phe 
200 . 


aaa agt 
Lys Ser 


teg 
Ser 


aaa 
Lys 
205 


ttg tac 
Leu Tyr 


1. _ 
tat 

Tyr 


gtt 
Val 


atg 
Met 
210 


aag 
•Lys 


"ctg 
Leu 


etc 
Leu 


aeg 
Thr 


aat gtt get 
Asn Val Ala 
215 


att ttt 
•He Phe 


get 
Ala 
220 


gcg 

Ala 


age att 
Ser He 


gca 
Ala 


ata 
He 
225 


ata 
He 


tgt 
Cys 


tgg 
Trp 


age 
Ser 


aag 
Lys 
230 


act att tea 
Thr He Ser 


gcg gtt 
Ala Val 
235 


ttg 
Leu 


get 
Ala 


tea get 
Ser Ala 


tgt 
Cys 
240 


atg 
Met 


atg 
Met 


get 
Ala 


ctg 
Leu 


tgt 
Cys 
245 


ttc 
Phe 


caa cag tgc 
Gin Gin Cys 


gga tgg 
Gly Trp 
250 


eta 
Leu 


tec 
Ser 


eat gat 
His Asp 
255 


ttt 
Phe 


etc 
Leu 


cac 
His 


aat 
Asn 


cag 
Gin 
260 


gtg 
Val 


ttt 
Phe 


gag. aca ege 
Glu Thr Arg 
265 


tgg ctt 
Trp Leu 


aat 
Asn 


gaa 
Glu 


gtt gte 
Val Val 
270 


ggg 

Gly 


tat 
Tyr 


gtg 
val 


ate 
He 
.275 


ggc 

Gly 


aac 
Asn 


gee 
Ala 


gtt ctg ggg 
Val Leu Gly 
280 


ttt agt 
Phe Ser 


aea 
Thr 


ggg 

Gly 
285 


tgg tgg 
Trp Trp 


aag 
Lys 


gag 
Glu 


aag 
Lys 
290 


cat 
His 


aac 
Asn 


ctt 
Leu 


eat 
His 


eat get get 
His Ala Ala 
295 


cea aat 
Pro Asn 


gaa 
Glu 
300 


tgc 
Cys 


gat cag 
Asp Gin 


act 
Thr 



288 



336 



384 



432 



480 



528 



576 



624 



672 



720 



768 



816 



864 



912 
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tac caa cca att gat gaa gat att gat act etc ccc etc att gcc tgg 960 
Tyr Gin Pro lie Asp Glu Asp lie Asp Thr Leu Pro Leu lie Ala Trp 
305 310 315 320 

age aag gae ata ctg gcc aca gtt gag aat aag aca ttc ttg cga ate " 1008 
Ser Lys Asp lie Leu Ala Thr Val Glu Asn Lys Thr Phe Leu Arg lie 
325 330 335 

etc caa tac cag cat ctg ttc ttc atg ggt ctg tta ttt ttc gee cgt 1056 
Leu Gin Tyr Gin His Leu Phe Phe Met Gly Leu Leu Phe Phe Ala Arg 
340 345 350 

ggt agt tgg etc ttt tgg age tgg aga tat ace tct aca gca gtg etc 1104 
Gly Ser Trp Leu Phe Trp Ser Trp Arg Tyr Thr Ser Thr Ala Val Leu 
355 360 365 

tea ect gte gae agg ttg ttg gag aag gga act gtt ctg ttt eac tac 1152 
Ser Pro Val Asp Arg Leu Leu Glu Lys Gly Thr Val Leu Phe His Tyr 
370. . 375 ,380 

ttt tgg ttc gtc ggg'aca geg tgc tat ctt etc ect ggt tgg aag cca 1200 
Phe Trp Phe Val Gly Thr Ala Cys Tyr Leu Leu Pro Gly Trp Lys Pro 

385 390 . ■ 395 * • 400 

tta gta tgg atg geg gtg act gag etc atg tec ggc atg ctg ctg ggc 1248 
Leu Val Trp Met Ala Val Thr Glu Leu Met Ser Gly Met Leu Leu Gly 
405 410 415 

ttt gta ttt gta ctt age cac aat ggg atg gag gtt tat aat teg tct 1296 
Phe Val Phe Val Leu Ser His Asn Gly Met Glu Val Tyr Asn Ser Ser 
420 425 430 

aaa gaa ttc gtg agt gca cag 'ate gta tec aca. egg gat ate aaa gga 1344 
Lys Glu Phe Val Ser .Ala Gin lie Val Ser Thr Arg Asp lie Lys Gly 
435 * 440 445 

\:\ ^ ' 

aac ata ttc aac gae tgg ttc act ggt ggc ctt aaC agg caa ata gag 1392 
Asn lie Phe Asn Asp Trp Phe Thr Gly Gly Leu Asn Arg Gin lie Glu 
450 . LJ.'455 460 • 

cat eat ctt ttc cca aca atg ccc agg cat aat tta aac aaa ata gca 1440 
His His Leu Phe Pro Thr Met Pro Arg His Asn Leu Asn Lys lie Ala 
465 470\ . 475 480 

ect aga gtg gag gtg ttc tgt aag aaa cac ggt ctg gtg tac gaa gae 1488 
Pro. Arg Val Glu Val Phe Cys Lys Lys His Gly Leu Val Tyr Glu Asp 
485 490 495 

gta tct att get ace ggc act tgc aag gtt ttg aaa gca ttg aag gaa 1536 
Val Ser He Ala llir Gly Thr Cys Lys Val Leu Lys Ala Leu Lys Glu 
500 505 510 

gtc geg gag get geg gca gag cag cat get ace ace agt taa 1578 
Val Ala Glu Ala Ala Ala Glu Gin His Ala Thr Thr Ser 
515 520 525 



<210> 8 
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<211> 525 
<212> PRT 

<213> Physcomitrella patens 
<400> 8 

Met Val Phe Ala Gly Gly Gly Leu Gin Gin Gly Ser Leu Glu Glu Asn 
.15 10 15 

lie Asp Val Glu His He Ala Ser Met Ser Leu Phe Ser Asp Phe Phe 
20 25 30 

Ser Tyr Val Ser Ser Thr Val Gly Ser Trp Ser Val His Ser He Gin 
35 40 '45 

Pro Leu Lys Arg Leu Thr Ser Lys Lys Arg Val Ser Glu Ser Ala Ala 
50 . 55 60 

Val Gin Cys He Ser Ala Glu Val Gin Arg Asn Ser Ser Thr Gin Gly 
65 70 75 80 

Thx Ala Glu Ala Leu .Ala Glu Ser Val Val Lys Pro Thr Arg Arg Arg 
85 90 95 

Ser Ser Gin Trp Lys Lys Ser Thr His Pro Leu Ser Glu Val Ala Val 
100 105 • 110 

His Asn Lys Pro Ser Asp Cys Trp He Val Val Lys Asn Lys Val Tyr 
115 120 125 

Asp Val Ser Asn Phe Ala Asp Glu His Pro Gly Gly Ser Val He Ser 
130 135 140 

Thr Tyr Phe Gly Arg Asp Gly Thr Asp Val Phe Ser Ser Phe His Ala 
145 150 155 . 160 

Ala Ser Thr Trp Lys He Leu Gin Asp Phe Tyr He Gly Asp Val Glu 
165 170 175 

Arg Val Glu Pro Thr Pro Glu Leu Leu Lys Asp Phe Arg Glu Met Arg 
180 185 190 

Ala Leu Phe Leu Arg Glu Gin Leu Phe Lys Ser Ser Lys Leu Tyr Tyr 
195 200 205 

Val Met Lys Leu Leu Thr Asn Val Ala He Phe Ala Ala Ser He Ala 
210 215 220 

He He Cys Trp Ser Lys Thr He Ser Ala Val Leu Ala Ser Ala Cys 
225 230 235 240 

Met Met Ala Leu Cys Phe Gin Gin Cys Gly Trp Leu Ser His Asp Phe 
245 250 255 

Leu His Asn Gin Val Phe Glu Thr Arg Trp Leu Asn Glu Val Val Gly 
260 265 270 , 

Tyr Val He Gly Asn Ala Val Leu Gly Phe Ser Thr Gly Trp Trp Lys 
275 280 285 
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Glu Lys His Asn Leu His His Ala Ala Pto Asn Glu Cys Asp Gin Thr 
290 295 300 

Tyr Gin Pro He Asp Glu Asp He Asp Thr Leu Pro Leu He Ala Trp 
305 310 315 320 

■ Ser Lys Asp He Leu Ala Thr Val Glu Asn Lys Thr Phe Leu Arg He 
325 330 .335 

Leu Gin Tyx Gin His Leu Phe Phe Met Gly Leu Leu Phe Phe Ala Arg 

340 345 . 350 

Gly Ser Trp Leu Phe Trp Ser Tjcp Arg Tyr Thr Ser Thr Ala Val Leu 
355 360 . 365 

Ser Pro Val Asp Arg Leu Leu Glu Lys Gly Thr Val Leu Phe His Tyr 
370 . 375 -380 

Phe Tip Phe Val Gly Thr Ala Cys Tyr Leu Leu Pro Gly Txp Lys Pro 
385 390 395 400 

. Leu Val Tip Met Ala Val Thr Glu Leu Met Ser Gly Met Leu Leu Gly 
405 410 415 

Phe Val Phe Val Leu Ser His Asn Gly Met Glu Val Tyr Asn Ser Ser 
420 425 430 

Lys Glu Phe Val Ser Ala Glh He Val Ser Thr Arg Asp He Lys Gly 
435 440 445 

Asn He Phe Asn Asp Trp Phe Thr Gly Gly Leu Asn Arg Gin He Glu 
. 450 455 460 

His His Leu Phe Pro Thr Met Pro Arg His Asn Leu Asn Lys He Ala 
465 470 475 480 

Pro Argr val Glu Val Phe Cys Lys Lys His Gly Leu Val Tyr Glu Asp 
485 490 495 

Val Ser He Ala Thr Gly Thr Cys Lys Val Leu Lys Ala Leu Lys Glu 
500 505 510 



Val Ala Glu Ala Ala Ala Glu Gin His Ala Thr Thr Ser 
515. 520 525 



<210> 9 
<211> 873 

<212> DNA 

<213> Physcomitrella patens 



<220> 

<221> CDS 

<222> (1) (873) 

<400> 9 

atg gag gtc gtg gag aga ttc tac ggt gag ttg gat ggg aag gtc teg 



Met Glu Val Val Glu Arg Phe Tyr 
. 1 5 

cag ggc gtg aat gca ttg ctg ggt 
'Gin Gly Val Asn Ala Leu Leu Gly 
20 
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Gly Glu Leu Asp Gly Lys Val Ser 
10 15 

agt ttt ggg gtg gag ttg acg gat 96 
Ser Phe Gly Veil Glu Leu Thr Asp 
25 30 



acg ccc act acc aaa ggc ttg ccc etc gtt gac agt ccc aca ccc ate- 144 
Thr Pro Tlir Thr Lys Gly Leu Pro Leu Val Asp Ser Pro Thr Pro lie 
35 40 45 

gtc etc ggt gtt tct gta tac ttg act att gtc att gga ggg ctt ttg 192 
Val Leu Gly Val Ser Val Tyr Leu Thr lie Val lie Gly Gly Leu Leu 
50 ' 55 60 

•tgg ata aag gcc agg gat ctg aaa ccg cgc gcc teg gag cca ttt ttg 240 
Trp lie Lys Ala Arg Asp Leu. Lys Pro Arg Ala Ser Glu Pro Phe Leu . 
65 . . 70 • 75 80 

etc caa get ttg gtg ett gtg cae aac ctg tt'c tgt ttt gcg etc agt 288 
Leu Gin Ala Leu Val Leu Val His Asn Leu Phe Cys Phe Ala Leu Ser 
85. 90 .95 

ctg tat atg tgc gtg ggc ate get tat cag get att acc tgg egg tac 336 
Leu Tyr Met Cys Val Gly lie Ala Tyr Gin Ala lie Thr Trp Arg Tyr 
100 105 110 

tct etc tgg ggc aat gca tac aat cct aaa cat aaa gag atg gcg att 384 
Ser Leu Trp Gly Asn Ala Tyr Asn Pro Lys His Lys Glu Met Ala lie 
115 120 125 

ctg gta tac ttg tte tac atg tct aag tac gtg gaa ttc atg gat ace 432 
Leu Val Tyr Leu Phe Tyr Met Ser Lys Tyr Val Glu Phe Met Asp Thr 
130 . 135 . . . 140 

gtt ate atg ata ctg eiag cgc age acc agg caa ata age- ttc etc cae 480 
Val lie Met lie Leu Lys Arg Ser' Thr' Arg Gin lie Ser Phe Leu His 
145 150 155 160 

gtt tat cat cat tct tea att tec etc att tgg tgg get att get cat 528 
Val Tyr His His Ser Ser lie. Ser Leu lie Trp Trp Ala lie Ala His 
165 170 175 

cae get cct ggc ggt gaa gca tat tgg tct gcg get ctg aac tea gga 576 
His Ala Pro Gly Gly Glu Ala Tyr Trp Ser Ala Ala Leu Asn Ser Gly 
180 185 190 

gtg eat gtt etc atg tat gcg tat tac ttc ttg get gcc tgc ett cga 624 
Val His Val Leu Met Tyx Ala Tyr Tyr Phe Leu Ala Ala Cys Leu Arg 
195 200 205 

agt age cca aag tta aaa aat aag tac ctt ttt tgg ggc agg tac ttg 672 
Ser Ser Pro Lys Leu Lys Asn Lys Tyr Leu Phe Trp Gly Arg Tyr Leu 
210 215 220 

aca caa ttc caa atg ttc cag. ttt atg ctg aac tta gtg cag get tac 720 
Thr Gin Phe Gin Met Phe Gin Phe Met Leu Asn Leu Val Gin Ala Tyr 
225 230 235 240 
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tac gac atg aaa acg aat gcg cca tat cca caa tgg ctg ate aag att 768 
Tyr Asp Met Lys Thr Asn Ala Pro Tyr Pro Gin Trp Leu He Lys He 

245 250 255 

ttg ttc tac tac atg ate teg ttg ctg ttt ctt ttc ggc aat ttt tac 816 
Leu Phe Tyr Tyr Met He Ser Leu Leu Phe Leu Phe Gly Asn Phe Tyr 
260 . 265 • 270 • 

gta caa aaa tac ate aaa ccc tct gac gga aag caa aag gga get aaa 864 
Val Gin Lys Tyr He Lys Pro Ser Asp Gly Lys Gin Lys Gly Ala Lys 
275 280 285 

act gag tga 873 
Thr Glu 
290 



<210>. 10 
<211> 290 
<212> PRT 

<213> Physcomitrella patens 
<400> 10 • 

Met Glu Val Val Glu Arg Phe Tyr Gly Glu Leu Asp Gly Lys Val Ser 
.1 ■ 5 10 15 • 

Gin Gly Val Asn Ala Leu Leu Gly Ser Phe Gly Val Glu Leu Thr Asp 
20 25 30 

Thr Pro Thr Thr Lys Gly Leu Pro Leu Val Asp Ser Pro Thr Pro He 
35 40 45 

Val Leu Gly Val Ser Val Tyr Leu Tfir He Val He Gly Gly Leu Leu 
50 -55 60 

Trp He Lys Ala Arg Asp Leu Lys Pro Arg Ala Ser Glu Pro Phe Leu 
65 70 75 80 

Leu Gin Ala Leu Val Leu Val His Asn Leu Phe Cys Phe Ala Leu Ser 
85 90 - 95 

Leu Tyr, Met Cys Val Gly He Ala Tyr Gin Ala He Thr Trp Arg Tyr 
100 105 110 

Ser Leu Trp Gly Asn Ala Tyr Asn- Pro Lys His Lys Glu Met Ala He 
115 • 120 125 

Leu Val Tyr Leu Phe Tyr Met Ser Lys Tyr Val Glu Phe Met Asp Thr 
130 135 140 

Val He Met He Leu Lys Arg Ser Thr Arg Gin He Ser Phe Leu His 
145 150 155 160 

Val Tyr His His Ser Ser He Ser Leu He Trp Trp Ala He Ala His 
165 . 170 175 

His Ala Pro Gly Gly Glu Ala Tyr Trp Ser Ala Ala Leu Asn Ser Gly 



180 



20 

185 



190 



Val His Val Leu Met Tyr Ala Tyr Tyr Phe lieu Ala Ala Cys Leu Arg 
195 200 205 . 

Ser Ser Pro Lys Leu Lys Asn Lys Tyr Leu Phe Trp Gly Arg Tyr Leu 
210 215 220 

Thr Gin Phe Gin Met Phe Glh Phe Met Leu Asn Leu Val Gin Ala Tyr 
225 230 235 240 

Tyr Asp Met Lys Thr Asn Ala Pro Tyr. Pro Gin Trp Leu lie Lys lie 
245 . . 250 255 

Leu Phe Tyr Tyr Met He Ser Leu Leu Phe Leu Phe Gly Asn Phe Tyr . 
260 265 . 270 

Val Gin Lys Tyr He Lys Pro Ser Asp Gly Lys Gin Lys Gly Ala Lys 
275 280 285. 

Thr Glu 
290 



<210> 11 
<211> 1526 
■<212> DNA 

<!213> Fhaeodactylum tricomutum 

<220> 

<221> CDS 

<222> (92)., (1402) 

<400> 11 

gcttccgtta gcgtcccata gtttgttaca cttggctgtg aaacgaatac gttcttggtc 60 

tacttactac aacgaagcaa ccaccagcag c atg ggt aag gga ggt caa cga 112 

Met Gly Lys Gly Gly Gin Arg 
1 . 5 

get gta get ccc aag agt gcc acc age tct act gge agt get acc ett 160 
Ala Val Ala Pro Lys Ser Ala Thr Ser Ser Thr Gly Ser Ala •flir Leu 
10 15 20 

age caa age aag gaa eag gta tgg act teg teg tae aac cet ctg geg 208 
Ser Gin Ser Lys Glu Gin Val Trp Thr Ser Ser Tyr Asn Pro Leu Ala 
25 30. 35 

aag gat tec ccg. gag ctg eca acc asia ggc caa ate aag gcc gtc att 256 
Lys Asp Ser Pro Glu Leu Pro Thr Lys Gly Gin He Lys Ala Val He 
40 45 50 . 55 . 

ccg aag gaa tgt tte caa cgc tea gcc ttt tgg tct acc tte tae ctg 304 
Pro Lys Glu Cys Phe Gin Arg Ser Ala Phe Trp Ser Thr Phe Tyr Leu 
60 . 65 70 

atg cgc gat etc gcc atg get gcc gcc ttt tgc tac gga acc tea cag 352 
Met Arg Asp Leu Ala Met Ala Ala Ala Phe Cys Tyr Gly Thr Ser Gin 
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.75 80 85 

gtc etc tec acc gac ctt ccc caa gac gcc acg etc att ctg ccc tgg 400 
Val Leu Ser Thr Asp Leu Pro Gin Asp Ala Thr Leu lie Leu Pro Trp 
90 95 100 

get etc ggc tgg ggc gtc tac gcc ttt tgg atg gga acc att etc acc 448 
Ala Leu Gly Trp Gly Val Tyr Ala Phe Trp Met Gly Thr lie Leu Thr 
105 110 115 

ggg cct tgg gta gtt gcg cac gaa tgt gga cac ggc get tac tec gac 496 
Gly Pro Trp Val Val Ala His Glu Cys Gly His Gly Ala Tyr Ser Asp 
120 . 125 130 135, 

tec cag acg ttc aat gac gtg gtc ggc ttt ate gtc cac caa get ttg 544 
Ser Gin Thr Phe Asn Asp Val Val Gly Phe He Val His* Gin Ala Leu 
140 145 150 

etc gtc ccc tac ttt gcc tgg cag tac acc cac gcg aaa cac cac cgt 592 
Leu ykl Pro Tyr Phe Ala Trp Gin Tyr Thr His Ala Lys His His Arg 
155 160 165 

cga acc -aac cat ctg gtg gac ggc gag tee cac gtc cct tct acc gee 640 
Arg Thr Asn His Leu Val Asp Gly Glu Ser His Val Pro Ser Thr Ala 

170 175 180 

aag gat aac ggc etc ggg ccg cac aaq gag cga aac tec ttc tac gee 688 
Lys Asp Asn Gly Leu Gly Pro His Asn Glu Arg Asn Ser Phe "^yr Ala 
185 190 195 

gcg tgg cac gag gcc atg gga gac' ggc gcc ttt gee gtc ttt caa gtc 736 
Ala Trp His Glu Ala Met Gly Asp Gly Ala Phe Ala Val Phe Gin Val 
200 205 210 215 • 

tgg . teg cac ttg ttc gtc ggc tgg cct etc tac ttg gcc ggt ctg gcc 784 
Trp Ser His Leu Phe Val Gly Trp Pro Leu Tyr Leu Ala Gly Leu Ala 
220 225 230 

agt acc gga aag ctt gcg cac gaa ggt tgg tgg ctg gaa' gaa egg aac 832 
Ser Thr Gly Lys Leu Ala His Glu Gly Trp Trp Leu Glu Glu Arg Asn 
235 240 245 

gcg att gcg gat cac ttt cga ccc age tct. ccc atg ttc ccc gee aag 880 
Ala He Ala Asp His Phe Arg Pro Ser Ser Pro Met Phe P.ro Ala Lys 
250 255 260 

ate cgt gee aag att gee ctt tee age gcg acg gaa etc gee gtg etc 928 
He Arg Ala Lys He Ala Leu Ser Ser Ala Thr Glu Leu Ala Val Leu 
265 270 275 

get gga etc ttg tat gtc ggt aca cag gtc gga cac ctt ccc gtc ctg 976 
Ala Gly Leu Leu Tyr Val Gly Thr Gin Val Gly His Leu Pro Val Leu 
280 285 290 295 



ctg tgg tac tgg gga ccg tac ace ttt gtc aac get tgg ctt gta etc 
Leu Trp Tyr Trp Gly Pro Tyr Thr Phe Val Asn Ala Trp Leu Val Leu 
300 305 310 



1024 



22 



tac acg tgg ctg cag cat acg gac ccg tec ate ccg cac tac ggt gaa 1072 
Tyr Thr Trp Leu Gin His Tihr Asp Pro Ser lie Pro His Tyr Gly Glu 
315 320 325 

ggc gag tgg acc tgg gtc aag ggc gcg etc tct acc att gat cga gac 1120 
Gly Glu Trp Thr Trp Val Lys Gly Ala Leu Ser Thr lie Asp Arg Asp 
330 . 335 340 

tac ggc ate ttc gat ttc ttt cac eac acc ate ggt tec acg cac gtg 1168 
Tyr Gly He Phe Asp Phe Phe His His Thr He Gly Ser Thr His Val 
345 350 -355 

gta cac cat ttg ttc cac gaa atg ecc tgg tac aat gcc ggc att gcc 1216 
Val His His Leu Phe His Glu Met Pro Trp Tyr Asn Ala Gly He Ala 
360 365 370 375 

acg caa aag gtc aag gaa ttt ttg gaa ecc cag ggc ttg tac aat tac 1264 
Thr Gin Lys Val Lys Glu Phe Leu Glu Pro Gin Gly Leu Tyr Asn Tyr 
380. 385 390 

gat ccg acc ecc tgg tac aag gcc atg tgg cgc att gcc egg acc tgt 1312 
Asp' Pro Thr Pro Txp Tyr Lys Ala Met Trp Arg He Ala Arg Thr Cys 
395 * 400 ^405 

cac tat gtg gag tea aac gag ggt gtg cag tat ttc aag agt atg gaa 1360 
His Tyr Val Glu Ser Asn Glu Gly Val Gin Tyr Phe Lys Ser Met Glu 
410 415 420 

aac gtg ccg ctg act aag gat gtg cga aac aaa gee gca tga 1402 
Asn Val Pro Leu Thr Lys Asp Val Arg Asn Lys Ala Ala 
425 43P 435 

gaaaaagtgc caccgacgea taattttaca atectaccaa caagaceaac attatatggt 1462 

tttcgcttaa aagatagttt tttctaccat ctgtgtagtc ggcacaaaaa aaaaaaaaaa 1522 

aaaa 1526 



<210> 12 

<211> 43.6 

<212> PRT 

<213> Phaeodactylum tricomutuiti 

<400> 12 

Met Gly Lys Gly Gly Gin Arg Ala Val Ala Pro Lys Ser Ala Thr Ser 
1 5 • 10 15 . 

Ser Thr Gly Ser Ala Thr Leu Ser Gin Ser Lys Glu Gin Val Trp Thr 
20 * 25 * 30 

Ser Ser Tyr Asn Pro Leu Ala Lys Asp Ser Pro Glu Leu Pro Thr Lys . 
35 40 45 

Gly Gin He Lys Ala Val He Pro Lys Glu Cys Phe Gin Arg Ser Ala 
'50 55 60 

Phe Trp Ser Thr Phe Tyr Leu Met Arg Asp Leu Ala Met Ala Ala Ala 
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65 



70 



75 



80 



Phe Cys Tyr Gly Thr Ser Gin Val Leu Ser Thr Asp Leu Pro Gin Asp 
85 90 95 

Ala Thr Leu lie Leu Pro Trp Ala Leu Gly Trp Gly Val Tyr Ala Phe 
100 105 110 

Trp Met Gly Thr He Leu. Thr Gly Pro Trp Val Val Ala His Glu Cys 
115 120 125 

Gly His Gly Ala Tyr Ser Asp Ser Gin Thr Phe Asn Asp Val Vai Gly 
■ ' 130 135 140 

Phe He Val His Gin Ala Leu Leu Val Pro Tyr Phe Ala Trp Gin Tyr 
145 150 155 160. 

Thr His Ala Lys His His Arg Arg Thr Asn His Leu Val Asp Gly Glu 
• 165 170 175 

Ser His Val Pro Ser Thr Ala Lys Asp Asn Gly Leu Gly Pro His Asn 
180 '185 190 

Glu Arg Asn Ser Phe Tyr Ala Ala Trp His Glu Ala Met Gly Asp Gly 
195 200 ■ 205 

Ala Phe Ala Val Phe Gin Val Tip Ser His Leu Phe Val Gly Trp Pro 
210 215 ■ 220 

Leu Tyr Leu Ala Gly Leu Ala Ser Thr Gly Lys Leu Ala His Glu Gly 
225 230 235 240 

Trp Trp Leu Glu Glu Arg Asn Ala He. Ala Asp His Phe* Arg Pro Ser 
245 - . 250 255 

Ser Pro Met Phe Pro Ala Lys He Arg Ala Lys He Ala Leu Ser Ser 
260 265 270 

Ala Thr Glu Leu Ala Val Leu Ala Gly Leu Leu Tyr Val Gly Thr Gin " 
275 280 285 

Val Gly His Leu Pro- Val Leu Leu Trp Tyr Trp Gly Pro Tyr Thr Phe 
290 295 ; 300 

Val Asn Ala Trp Leu Val Leu Tyr Thr Trp Leu Gin His Thr Asp Pro 
305 310 315 320 



Ser He Pro His Tyr Gly Glu Gly Glu Trp Thr Trp Val Lys Gly Ala 
325 330 335 

Leu Ser Thr He Asp Arg Asp Tyr Gly He Phe Asp Ph^ Phe His His 
. 340 345 350 

Thr . He Gly Ser Thr His Val Val His His Leu Phe His Glu Met Pro 
355 360 365 



Trp Tyr Asn Ala Gly He Ala Thr Gin Lys Val Lys Glu Phe Leu Glu- 
370 375 380 



24 



Pro Gin Gly Leu Tyr Asn Tyr Asp Pro Thr Pro Trp Tyr Lys Ala Met 
385 390 395 400 

Trp Arg lie Ala Arg Thr Cys His Tyr Val Glu Ser Asn Glu Gly Val 
405 410 415 

Gin Tyr Phe Lys Ser Met Glu Asn Val Pro Leu Thr Lys Asp Val Arg 
420 425 430 

Asn Lys Ala Ala 
435 



<210> 13 
<211> 3598 
<212> DNA 
<213> Unknown 

<220> 

<223> Sequenz stellt eine pflanzliche 

Promotor-Tenninator-Eacpressionskassette in Vektor 
PUC19 dar 

<400> 13 



tcgcgcgttt. cggtgatgac 


ggtgaaaacc 


tctgacacat 


gcagctcccg 


^agacggtca 


ou 


cagcttgtct 


gtaagcggat 


gccgggagca 


gacaagcccg 


tcagggcgcg 


tcagcgggtg 


120 


ttggcgggtg 


tcggggctgg 


cttaactatg 


cggcatcaga 


gcagattgta 


ctgagagtgc 


180 


accatatgcg 


gtgtgaaata 


ccgcacagat 


gcgtaaggag 


aaaataccgc 


atcaggcgcc 


240 


attcgccatt 


caggctgcgc 


aactgttggg 


aagggcgatc 


ggtgcgggcc 


tcttcgctat 


300 


tacgccagct 


ggcgaaaggg 


ggatgtgctg 


caaggcgatt 


aagrttgggta 


acgccagggt 


360 


tttcccagtc 


acgacgttgt 


aaaacgacgg 


ccagtgaatt 


cggcgcgccg 


agctcctcga 


420 


gcaaatttac 


acattgccac 


taaacgtcta 


aacccttgta 


atttgttttt 


gttttactat 
tataacacct 


480 


gtgtgttatg 


tatttgattt 


gcgataaatt 


tttatatttg 


gtactaaatt 


540 . 


tttatgctaa 


cgtttgccaa 


cacttagcaa 


tttgcaagtt 


gattaattga 


ttctaaatta 


600' 


tttttgtctt 


ctaaatacat 


atactaatca 


actggaaatg 


taaatatttg 


ctaatatttc 


660 


tactatagga 


gaattaaagt 


gagtgaatat 


ggtaccacaa 


ggtttggaga 


tttaattgtt 


720 


gcaatgctgc 


atggatggca 


tatacaccaa 


acattcaata 


attcttgagg 


ataataatgg 


780 


taccacacaa 


gatttgaggt 


gcatgaacgt 


cacgtggaca 


aaaggtttag 


taatttttca 


840 


agac€Lacaat 


gttaccacac 


acaagttttg 


aggtgcatgc 


atggatgccc 


tgtggaaagt 


900 


ttaaaaatat 


tttggaaatg 


atttgcatgg 


aagccatgtg 


taaaaccatg 


acatccactt 


960 


ggaggatgca 


ataatgaaga 


aaactacaaa 


tttacatgca 


actagttatg 


catgtagtct 


1020 



atataatgag gattttgcaa tactttcatt 
taatttcttc atagccagcc caccgcggtg 
gctttaatga gatatgcgag acgcctatga 
gcacgttgta aaaaacctga gcatgtgtag 
tctaatgaat atatcacccg ttactatcgt 
tactgattgt ccgtcgacga attcgagctc 
tagctgtttc ctgtgtgaaa ttgttatccg 
agcataaagt gtaaagcctg gggtgcctaa 
cgctcactgc ccgctttcca gtcgggaaac 
caacgcgcgg ggagaggcgg tttgcgtatt 
tcgctgcgct cggtcgttcg gctgcggcga 
cggttatcca cagaatcagg ggataacgca 
aaggccagga accgtaaaaa ggccgcgttg 
gacgagcatc acaaaaatcg acgctcaagt 
agataccagg cgtttccccc tggaagctcc 
cttaccggat acctgtccgc ctttctccct 
cgctgtaggt atotcagttc . ggtgtaggtc 
ccccccgttc agcccgaccg ctgcgcctta 
gtaagacacg.acttatcgcc actggcagca 
tatgtaggcg gtgctacaga gttcttgaag 
acagtatttg gtatctgcgc tctgctgaag 
tcttgatccg gcaaacaaac caccgctggt 
attacgcgca gaaaaaaagg atctca^aa 
gctcagtgga acgaaaactc acgttaaggg 
ttcacctaga tccttttaaa ttaaaaatga 
taaacttggt ctgacagtta ccaatgctta 
ctatttcgtt catccatagt tgcctgactc 
ggcttaccat ctggccccag tgctgcaatg 
gatttatcag caataaacca gccagccgga 
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catacacact cactaagttt tacacgatta 1080 
ggcggccgcc tgcagtctag aaggcctcct 1140 
tcgcatgata tttgctttca attctgttgt 1200 
ctcagatcct taccgccggt ttcggttcat 1260 
atttttatga ataatattct ccgttcaatt 1320 
ggcgcgccaa gcttggcgta atcatggtca 1380 
ctcacaattc cacacaacat acgagccgga 1440 
tgagtgagct aactcacatt aattgcgttg 1500 
ctgtcgtgcc agctgcatta atgaatcggc 1560 
gggcgctctt ccgcttcctc gctcactgac 1620 
gcggtatcag ctcactcaaa ggcggtaata 1680 
ggaaagaaca tgtgagcaaa aggccagcaa 1740 
ctggcgtttt tccataggct ccgcccccct 1800 
cagaggtggc gaaacccgac aggactataa 1860 
ctcgtgcgct ctcctgttcc gaccctgccg 1920 
tcgggaagcg tggcgctttc tcatagctca 1980 
gttcgctcca agctgggctg tgtgcacgaa 2040 
tccggtaact atcgtcttga gtccaacccg 2100 
gccactggta acaggattag cagagcgagg 2160 
tggtggccta actacggcta cactagaagg 2220 
ccagttacct tcggaaaaag agttggtagc 2280 
agcggtggtt tttttgtttg caagcagcag 2340 
gatcctttga tcttttctac ggggtctgac 2400 
attttggtca tgagattatc aaaaaggatc 2460 
agttttaaat caatctaaag tatatatgag 2520 
atcagtgagg cacctatctc agcgatctgt 2580 
cccgtcgtgt agataactac gatacgggag 2640 
ataccgcgag acccacgctc accggctcca 2700 
agggccgagc gcagaagtgg tcctgcaact 2760 
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ttatccgcct 


ccatccagtc 


tattaattgt 


tgccgggaag 


ctagagtaag 


tagttcgcca 




gttaatagtt 


tgcgcaacgt 


tgttgccatt 


gctacaggca 


tcgtggtgtc 


acgctcgtcg 


2ooU 


tttggtatgg 


cttcattcag 


ctccggttcc 


caacgatcaa 


ggcgagttac 


atgatccccc 


O Q /I A 

2940 


atgttgtgca 


aaaaagcggt 


tagctccttc 


ggtcctccga 


tcgttgtcag 


aagtaagttg 


•a A A A 


gccgcagtgt 


tatcactcat 


ggttatggca 


gcactgcata 


attctcttac 


tgtcatgcca 


•a A f A 


tccgtaagat 


gcttttctgt 


gactggtgag 


tactcaacca 


agtcattctg 


agaatagtgt 




atgcggcgac 


cgagttgctc 


ttgcccggcg 


tcaatacggg 


ataataccgc. 


.gccacatagc 


•a 1 o A 

3180 


agaactttaa 


aagtgctcat 


cattggaaaa 


cgttcttcgg 


ggcgaaaact 


ctcaaggatc 


3240 


ttaccgctgt 


tgagatccag 


ttcgatgtaa 


cccactcgtg 


cacccaactg 


atcttcagca 


O O A A 

3300 


tcttttactt 


tcaccagcgt 


ttctgggtga 


gcaaaaacag 


gaaggcaaaa 


tgccgcaaaa 


3360 


aagggaataa 


gggcgacacg 


gaaatgttga 


atactcatac 


"tcttcctttt 


tcaatattat 


3420 


tgaagcattt 


atcagggtta 


ttgtctcatg 


agcggataca 


tatttgaatg 


tatttagaaa 


3480 


aataaacaaa 


taggggttcc 


gcgcacattt 


ccccgaaaag 


tgccacctga 


cgtctaagaa 


3540 


accattatta 


tcatgacatt 


aacctataaa 


aataggcgta 


tcacgaggcc 


ctttcgtc 


3598 



<210> 14 
<211> 3590 
<212> DNA 
'<213> UxDcnovna 

<220> 

<223> Sequenz stellt eine pflanzliche 

Promotor-Tertninator-Expressionskassette in Vektor . 
pUC19 dar 

<400> 14 

tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60 
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120 
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180 
accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240 
attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300 
tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360 
tttcccagtc acgacgttgt aaeiacgacgg ccagtgaatt cggcgcgccg agctcctcga 420 
gcaaatttac acattgccac taaacgtcta aacccttgta atttgttttt gttttactat 480 
gtgtgttatg tatttgattt gcgataaatt tttatatttg gtactaaatt tataacacct 540 



tttatgctaa cgtttgccaa cacttagcaa 
tttttgtctt ctaaatacat atactaatca 
tactatagga gaattaaagt gagtgaatat 
gceiatgctgc atggatggca tatacaccaa 
taccacacaa gatttgaggt 'gcatgaacgt 
agacaacaat gttaccacac acaagttttg 
ttaaaaatat tttggaaatg'atttgcatgg 
ggaggatgca ataatgciaga aaactacaaa 
atataatgag gattttgcaa tactttcatt 
taatttcttc atagccagcg gatccgatat 
gagatatgcg agacgcctat gatcgcatga 
taaaaaacct gagcatgtgt agctcagatc 
atatatcacc cgttactatc gtatttttat 
gtccgtcgac gaattcgagc tcggcgcgcc 
tcctgtgtga ciattgttatc cgctcacaat 
gtgtaaagcc tggggtgcct aatgagtgag 
gcccgctttc cagtcgggaa acctgtcgtg 
ggggagaggc ggtttgcgta ttgggcgctc 
ctcggtcgtt cggctgcggc gagcggtatc 
cacagaatca ggggataacg caggaaagaa 
gaaccgtaaa aaggccgcgt tgctggcgtt 
tcacaaaaat cgacgctcaa gtcagaggtg 
ggcgtttccc cctggaagct ccctcgtgcg 
atacctgtcc gcctttctcc cttcgggaag 
gtatctcagt tcggtgtagg tcgttcgctc 
tcagcccgac cgctgcgcct tatccggtaa 
cgacttatcg ccactggcag cagccactgg 
cggtgctaca gagttcttga agtggtggcc 
tggtatctgc gctctgctga agccagttac 
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tttgcaagtt gattaattga ttctaaatta 600 
actggaaatg taaatatttg ctaatatttc 660 
ggtaccacaa ggtttggaga tttaattgtt 720 
acattcaata attcttgagg ataataatgg 780 
cacgtggaca aaaggttt'ag taatttttca 840 
aggtgcatgc atggatgccc tgtggaaagt 900, 
aagccatgtg taaciaccatg acatccactt 960 
tttacatgca-actagttatg catgtagtct 1020 
catacacact cactaagttt tacacgatta 1080 
cgggcccgct agcgttaacc ctgctttaat 1140 
tatttgcttt caattctgtt gtgcacgttg 1200 
cttaccgccg gtttcggttc attctaatga 1260 
gaataatatt ctccgttcaa tttactgatt 1320 
aagcttggcg taatcatggt catagctgtt 1380 
tccacacaac atacgagccg gaagcataaa 1440 
ctaactcaca ttaattgcgt tgcgctcact 1500 
ccagctgcat taatgaatcg gccaacgcgc 1560 
ttccgcttcc tcgctcactg actcgctgcg 1620 
agctcactca aaggcggtaa tacggttatc 1680 
catgtgagca aaaggccagc aaaaggccag 1740 
tttccatagg ctccgccccc ctgacgagca 1800 
gcgaaacccg acaggactat aaagatacca 1860 
ctctcctgtt ccgaccctgc cgcttaccgg 1920 
cgtggcgctt tctcatagct cacgctgtag 1980 
caagctgggc tgtgtgcacg aaccccccgt 2040 
ctatcgtctt gagtccaacc cggtaagaca 2100 
taacaggatt agcagagcga ggtatgtagg 2160 
taactacggc tacactagaa ggacagtatt 2220 
cttcggaaaa agagttggta gctcttgatc 2280 
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cggcaaacaia 


accaccgctg 


gtagcggtgg 


tttttttgtt 


tgcaagcagc agattacgcg 


2340 


cagaaaaaaa 


ggatctcaag 


aagatccttt 


gatcttttct 


acggggtctg acgctcagtg 


2400 


gaacgaaaac 


tcacgttaag 


ggattttggt 


catgagatta 


tcaaaaagga tcttcaccta 


2460 


gatcctttta 


aattaaaaat 


gaagttttaa 


atcaatctaa 


agtatatatg agtaaacttg 


2520 


gtctgacagt 


taccaatgct 


taatcagtga 


ggcacctatc 


tcagcgatct gtctatttcg 


2580 


ttcatccata 


gttgcctgac 


tccccgtcgt 


gtagataact 


acgatacggg agggcttacc 


2640 


atctggcccc 


agtgctgcaa 


tgataccgcg 


agacccacgc 


tcaccggctc cagatttatc 


2700 


agcaataaac 


cagccagccg 


gaagggccga 


gcgcagaagt 


ggtcctgcaa ctttatccgc 


2760 


ctccatccag 


tctattaatt 


gttgccggga 


agctagagta 


agtagttcgc cagttaatag 


2820 


tttgcgcaac 


gttgttgcca 


ttgctacagg 


catcgtggtg 


tcacgctcgt cgtttggtat 


2880 


ggcttcattc 


agctccggtt 


cccaacgatc 


aaggcgagtt 


acatgatccc ccatgttgtg 


2940 


caaaaaagcg 


gttagctcct 


tcggtcctcc 


gatcgttgtc 


agaagtaagt tggccgcagt 


3000 


gttatcactc 


atggttatgg 


cagcactgca 


taattctctt 


actgtcatgc catccgtaag 


3060 


atgcttttct 


gtgactggtg 


agtactcaac 


caagtcattc 


tgagaatagt gtatgcggcg 


3120 


accgagttgc 


tcttgcccgg 


cgtcaatacg 


ggataatacc 


gcgccacata gcagaacttt 


3180 


aaaagtgctc 


atcattggaa 


aacgttcttc 


ggggcgaaaa 


ctctcaagga tcttaccgct 


3240 


gttgagatcc 


agttcgatgt 


aacccactcg 


tgcacccaac 


tgatcttcag catcttttac 


3300 


tttcaccagc 


gtttctgggt 


gagcaaaaac 


aggaaggcaa 


aatgccgcaa aaaagggaat 


3360 


aagggcgaca 


cggaaatgtt 


gaatactcat 


actcttcctt 


tttcaatatt attgaagcat 


3420 


ttatcagggt 


tattgtctca 


tgagcggata 


catatttgaa 


tgtatttaga aaaataaaca 


3480 


aataggggtt 


ccgcgcacat 


ttccccgaaa 


agtgccacct 


gacgtctaag aaaccattat 


3540 


tatcatgaca 


ttaacctata 


aaaataggcg 


tatcacgagg 


ccctttcgtc 


3590 


<210> 15 
<211> 3584 













<212> DMA 



<213> Unknown 
<220> 

<223> Sequenz stellt eine pflanzliche 

Promotor-Terminator-Expressionskassette in Vektor 
PUC19 dar* 

<400> 15 

tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60 



' .. . I 
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cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120 
ttggcgggtg tcggggctgg cttaactatg cggcd!tcaga gcagattgta ctgagagtgc 180 
accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240 
attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300 
tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360 
tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt cggcgcgccg. agctcctcga 420 
gcaaatttac acattgccac taaacgtcta aacccttgta atttgttttt gttttactat 480 
gtgtgttatg tatttgattt gcgataaatt tttatatttg gtactaaatt tataacacct 540 
tttatgctaa cgtttgccaa cacttagcaa tttgcaagtt gattaattga ttctaaatta 600 
tttttgtctt ctaaatacat atactaatca actggaaatg taaatatttg ctaatatttc 660 
tactatagga gaattaaagt gagtgaatat ggtaccacaa ggtttggaga tttaattgtt 720 
gcaatgctgc atggatggca tatacaccaa acattcaata attcttgagg ataataatgg 780 
taccacacaa gatttgaggt gcatgaacgt cacgtggaca. aaaggtttag taatttttca 840 
agacaacaat gttaccacac acaagttttg aggtgcatgc atggatgccc tgtggaaagt 900 
ttaaaaatat tttggaaatg atttgcatgg aagccatgtg taaaaccatg acatccactt 960 
ggaggatgca ataatgaaga aaactacaaa tttacatgca actagttatg catgtagtct 1020 
atataatgag gattttgcaa tactttcatt catacacact cactaagttt tacacgatta 1080 
taatttcttc atagccagca gatctgccgg catcgatccc gggccatggc ctgctttaat 1140 
gagatatgcg agacgcctat • gatcgcatga tatttgcttt caattctgtt gtgcacgttg 1200 
taaaaaacct gagcatgtgt agctcagatc cttaccgccg gtttcggttc attctaatga 1260- 
atatatcacc cgttactatc gtatttttat gaataatatt ctccgttcaa tttactgatt 1320 
gtccgtcgac gagctcggcg cgccaagctt ggcgtaatca tggtcatagc tgtttcctgt 1380 
gtgaaattgt tatccgctca caattccaca caacatacga gccggaagca taaagtgtaa 1440 
agcctggggt gcctaatgag tgagctaact cacattaatt gcgttgcgct cactgcccgc 1500 
tttccagtcg ggaaacctgt cgtgccagct gcattaatga atcggccaac gcgcggggag 1560 
aggcggtttg cgtattgggc gctcttccgc ttcctcgctc actgactcgc tgcgctcggt 1620 
cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt tatccacaga 1680 
atcaggggat aacgc^ggaa agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg 1740 
taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa 1800 
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aaatcgacgc 


tcaagtcaga 


ggtggcgaaa 


cccgacagga 


ctataaagat 


accaggcgtt 


1860 


tccccctgga 


agctccctcg 


tgcgctctcc 


tgttccgacc 


ctgccgctta 


ccggatacct 


1920 


gtccgccttt 


ctcccttcgg 


gaagcgtggc 


gctttctcat 


agctcacgct 


gtaggtatct 


1980 


cagttcggtg 


taggtcgttc 


gctccaagct 


gggctgtgtg 


cacgaacccc 


ccgttcagcc 


2040" 


cgaccgctgc 


gccttatccg 


gtciactatcg 


tcttgagtcc 


aacccggtaa 


gacacgactt 


2100 


atcgccactg 


gcagcagcca 


ctggtaacag 


gattagcaga 


gcgaggtatg 


taggcggtgc 


2160 


tacagagttc 


ttgaagtggt 


ggcctaacta 


cggctacact 


agaaggacag 


tatttggtat 


2220 


ctgcgctctg 


ctgaagccag 


ttaccttcgg 


aaaaagagtt 


ggtagctctt 


gatccggcaa 


2280 


acaaaccacc 


gctggtagcg 


gtggtttttt 


tgtttgcaag 


cagcagatta 


cgcgcagaaa 


2340 


aaaaggatct 


caagaagatc 


ctttgatctt 


ttctacgggg 


tctgacgctc 


agtggaacga 


2400 


aaactcacgt 


taagggattt 


tggtcatgag 


attatcaaaa 


aggatcttca 


cctagatcct 


2460 


tttaaattaa 


aaatgaagtt 


ttaaatcaat 


ctaaagtata 


tatgagtaaa 


cttggtctga 


2520 


cagttaccaa 


tgcttaatca 


gtgaggcacc 


tatctcagcg 


atctgtctat 


ttcgttcatc 


2580 


catagttgcc 


tgactccccg 


tcgtgtagat 


aactacgata 


cgggagggct 


taccatctgg 


2640 


ccccagtgct 


gcaatgatac 


cgcgagaccc 


acgctcaccg 


gctccagatt 


tatcagcaat 


2700 


aaaccagcca 


gccggaaggg 


ccgagcgcag 


aagtggtcct 


gcaactttat 


ccgcctccat 


2760 


ccagtctatt 


etattgttgcc 


gggaagctag 


agtaagtagt 


tcgccagtta 


atagtttgcg 


2820 


caacgttgtt 


gccattgcta 


caggcatcgt 


ggtgtcacgc 


tcgtcgtttg 


gtatggcttc 


2880 


attcagctcc 


ggttcccaac 


gatcaaggcg 


agttacatga 


tcccccatgt 


tgtgcaaaaa 


2940. 


agcggttagc 


tccttcggtc 


ctccgatcgt 


tgtcagaagt 


aagttggccg 


cagtgttatc 


3000 


actcatggtt 


atggcagcac 


tgcataattc 


tcttactgtc 


atgccatccg 


taagatgctt 


3060 


ttctgtgact 


ggtgagtact 


caaccaagtc 


attctgagaa 


tagtgtatgc 


ggcgaccgag 


3120 


ttgctcttgc 


ccggcgtcaa 


tacgggataa 


taccgcgcca 


catagcagaa 


ctttaaaagt 


3180 


gctcatcatt 


ggaaaacgtt 


cttcggggcg 


etaaactctca 


aggatcttac 


cgctgttgag 


3240 






ctccrt'crcacc 


caac tcra. he t 


tcacrcatctt 


btacttitcac 


3300 


cagcgtttct 


gggtgagcaa 


aaacaggaag 


gcaaaatgcc 


gcaaaaaagg 


gaataagggc 


3360 


gacacggaaa 


tgttgaatac 


tcatactctt 


cctttttcaa 


tattattgaa 


gcatttatca 


3'420 


gggttattgt 


ctcatgagcg 


gatacatatt 


tgaatgtatt 


tagaaaaata 


aacaaatagg 


3480 


ggttccgcgc 


acatttcccc 


gaaaagtgcc 


acctgacgtc 


taagaaacca 


ttattatcat 


3540 
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gacattaacc tataaaaata ggcgtatcac gaggcccttt cgtc 3584 

<210> 16 
<211> 4507 
<212> DNA 
<213> UnJcnown 

<220> • 
<223> Sequenz stellt eine pflanzliche 

Promotor-Xerminator-Expressionskassette in Vektor 

pUC19 dar 



<^UU> J.O 

tcgcgcgttt 


cggtgatgac 


ggtgaaaacc 


tctgacacat 


gcagctcccg gagacggtca 


60 


cagcttgtct 


gtaagcggat 


gccgggagca 


gacaagcccg 


tcagggcgcg tcagcgggtg 


120 


ttggcgggtg 


tcggggctgg 


cttaactatg 


cggcatcaga 


gcagattgta ctgagagtgc 


180 


accatatgcg 


gtgtgaaata 


ccgcacagat 


gcgtaaggag 


aaaataccgc atcaggcgcc 


240 


attcgccatt 


caggctgcgc 


aactgttggg 


aagggcgatc 


ggtgcgggcc tcttcgctat 


300 


tacgccagct 


ggcgaaaggg 


ggatgtgctg 


caaggcgatt 


aagttgggta acgccagggt 


360 


tttcccagtc 


acgacgttgt 


aaaacgacgg 


ccagtgaatt 


cggcgcgccg agctcctcga 


420 


gcaaatttac 


acattgccac 


taaacgtcta 


aacccttgta 


atttgttttt gttttactat 


480 


gtgtgttatg 


tatttgattt 


gcgataaatt 


tttatatttg 


gtactaaatt tataacacct 


540 


tttatgctaa 


cgtttgccaa 


cacttagcaa 


tttgcaagtt 


gattaattga ttctaaatta 


600 


tttttgtctt 


ctaaatacat 


atactaatca 


actggaaatg 


taaatatttg ctaatatttc 


660 


tactatagga 


gaattaaagt 


gagtgaatat 


ggtaccacaa 


ggtttggaga tttaattgtt 


720 


gcaatgctgc 


atggatggca 


tatacaccaa 


acattcaata 


attcttgagg ataataatgg 


780 


taccacacaa 


gatttgaggt 


gcatgaacgt 


cacgtggaca 


aaaggtttag taatttttca 


840 


agacaacaat 


gttaccacac 


acaagttttg 


aggtgcatgc 


atggatgccc tgtggaaagt 


900 


ttaaaaatat 


tttggaaatg 


atttgcatgg 


aagccatgtg 


taaaaccatg acatccactt 


960 


ggaggatgca 


ataatgaaga 


aaactacaaa 


tttacatgca 


actagttatg catgtagtct 


1020 


atata^tgag 


gattttgcaa 


tactttcatt 


catacacact 


cactaagttt tacacgatta 


1080 


taatttcttc 


atagccagcc 


caccgcggtg 


ggcggccgcc 


tgcagtctag aaggcctcct 


1140 


gctttaatga 


gatatgcgag 


acgcctatga 


tcgcatgata 


tttgctttca attctgttgt 


1200 


gcacgttgta 


aaaaacctga 


gcatgtgtag 


ctcagatcct 


taccgccggt ttcggttcat 


1260 


tctaatgaat 


atatcacccg 


ttactatcgt 


atttttatga 


ataatattct ccgttcaatt 


1320 
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tactgattgt 


ccgtcgagca 


aatttacaca 


ttgccactaa 


acgtctaaac 


ccttgtaatt 


1380 


tgtttttgtt 


ttactatgtg 


tgttatgtat 


ttgatttgcg 


ataaattttt 


atatttggta 


1440 


ctaaatttat 


aacacctttt 


atgctaacgt 


ttgccaacac 


ttagcaattt 


gcaagttgat 


1500 


taattgattc 


taaattattt 


ttgtcttcta 


aatacatata 


ctaatcaact 


ggaaatgtaa 


1560 


atatttgcta 


atatttctac 


tataggagaa 


ttaaagtgag 


tgaatatggt 


accacaaggt 


1620 


ttggagattt 


aattgttgca 


atgctgcatg 


gatggcatat 


acaccaaaca' 


ttcaataatt 


1680 


cttgaggata 


ataatggtac 


cacacaagat 


ttgaggtgca 


tgaacgtcac 


gtggacaaaa 


1740 


ggtttagtaa 


tttttcaaga 


caacaatgtt 


accacacaca 


agttttgagg 


tgcatgcatg 


1800 


gatgccctgt 


ggaaagttta 


aaaatatttt 


ggaaatgatt 


tgcatggaag 


-ccatgtgtaa 


1860 


aaccatgaca 


tccacttgga 


ggatgcaata 


atgaagaaaa 


ctacaaattt 


acatgcaact 


1920 


agttatgcat 


gtagtctata 


taatgaggat 


tttjrcaatac 


tttcattcat 


acacactcac 


1980 


taagttttac 


acgattataa 


tttcttcata 


gccagcggat 


ccgatatcgg 


gcccgctagc 


2040 


gttaaccctg 


ctttaatgag 


atatgcgaga 


cgcctatgat 


cgcatgatat 


ttgctttcaa 


2100 


ttctgttgtg 


cacgttgtaa 


aaaacctgag 


catgtgtagc 


tcagatcctt 


accgccggtt 


2160 


tcggttcatt 


ctaatgaata 


tatcacccgt 


tactatcgta 


tttttatgaa 


taatattctc 


2220 


cgttcaattt 


actgattgtc 


cgtcgacgaa 


ttcgagctcg 


gcgcgccaag 


cttggcgtaa 


2280 


tcatggtcat 


agctgtttcc 


tgtgtgaaat 


tgttatccgc 


tpacaattcc 


acacaacata 


2340 


cgagccggaa 


gcataaagtg 


taaagcctgg 


ggtgcctaat 


gagtgagcta 


actcacatta 


2400 


a^ttgcgttgc 


gctcactgcc 


cgctttccag 


tcgggaaacc 


tgtcgtgcca- 


gctgcattaa 


2460 


tgaatcggcG 


aacgcgcggg 


gagaggcggt 


ttgcgtattg 


ggcgctcttc 


cgcttcctcg 


2520 


ctcactgact 


cgctgcgctc 


ggtcgttcgg 


ctgcggcgag 


cggtatcagc 


tcactcaaag 


2580 


gcggtaatac 


ggttatccac 


agaatcaggg 


gataacgcag 


gaaagaacat 


gtgagcaaaa 


2640 


ggccagcaaa 


aggccaggaa 


ccgtaaaaag 


gccgcgttgc 


tggcgttttt 


ccataggctc 


2700 


cgcccccctg 


acgagcatca 


caaaaatcga 


cgctcaagtc 


agaggtggcg 


aaacccgaca 


2760 




cratia.cc acrcrc 


gttbccccct: 


aaaaactccc 


tcgtgcgctc 


tcctgttccg 


2820 


accctgccgc 


ttaccggata 


cctgtccgcc 


tttctccctt 


cgggaagcgt 


ggcgctttct 


2880 


catagctcac 


gctgtaggta 


tctcagttcg 


gtgtaggtcg 


ttcgctccaa 


gctgggctgt 


2940 


gtgcacgaac 


cccccgttca 


gcccgaccgc 


tgcgccttat 


ccggtaacta 


tcgtcttgag 


3000 


tccaacccgg 


taagacacga 


cttatcgcca 


ctggcagcag 


ccactggtaa 


caggattagc 


3060 



agagcgaggt atgtaggcgg tgctacagag 
actagaagga cagtatttgg tatctgcgct 
gttggtagct cttgatccgg caaacaaacc 
aagcagcaga ttacgcgcag aaaaaaagga 
gggtctgacg ctcagtggaa cgaaaactca 
aaaaggatct tcacctagat ccttttaaat 
atatatgagt aaacttggtc tgacagttac 
gcgatctgtc tatttcgtto atccatagtt 
atacgggagg gcttaccatc tggccccagt 
ccggctccag atttatcagc aataaaccag 
cctgcaactt tatccgcctc catccagtct 
agttcgccag ttaatagttt gcgcaacgtt 
cgctcgtcgt ttggtatggc ttcattcagc 
tgatccccca tgttgtgcaa aaaagcggtt 
agtaagttgg ccgcagtgtt atcactcatg 
gtcatgccat ccgtaagatg cttttctgtg 
gaatagtgta tgcggcgacc gagttgctct 
ccacatagca gaactttaaa agtgctcatc 
tcaaggatct taccgctgtt gagatccagt 
tcttcagcat cttttacttt caccagcgtt 
gccgcaaaaa agggaataag ggcgacacgg 
caatattatt gaagcattta tcagggttat 
atttagaaaa ataaacaaat aggggttccg 
gtctaagaaa ccattattat catgacatta 
tttcgtc . 

<210> 17 
•<211> 5410 
<212> DNA 
<213> Un3cnovm 
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ttcttgaagt ggtggcctaa ctacggctac 3120 
ctgctgaagc cagttacctt cggaaaaaga 3180 
accgctggta gcggtggttt ttttgtttgc 3240 
tctcaagaag atcctttgat cttttctacg 3300 
cgttaaggga ttttggtcat gagattatca 3360 
taaaaatgaa gttttaaatc aatctaaagt 3420 
caatgcttaa tcagtgaggc acctatctca 3480 
gcctgactcc ccgtcgtgta gataactacg 3540 
gctgcaatga taccgcgaga cccacgctca 3600 
ccagccggaa gggccgagcg cagaagtggt 3660 
.attaattgtt gccgggaagc tagagtaagt 3720 
gttgccattg ctacaggcat cgtggtgtca 3780 
tccggttccc aacgatcaag gcgagttaca 3840 
agctccttcg gtcctccgat cgttgtcaga 3900 
gttatggcag cactgcataa ttctcttact 3960 
actggtgagt actcaaccaa gtcattctga 4020 
tgcccggcgt caatacggga taataccgcg 4080 
attggaaaac gttcttcggg gcgaaaactc 4140 
tcgatgtaac ccactcgtgc acccaactga 4200 
tctgggtgag caaaaacagg aaggcaaaat 4260 
aaatgttgaa tactcatact cttccttttt 4320 
tgtctcatga gcggatacat atttgaatgt 4380 
cgcacatttc cccgaaaagt gccacctgac 4440 
acctataaaa ataggcgtat cacgaggccc 4500 

• 4507 



<220> 
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<223> Sequenz stellt eine pflanzliche 

Proinotor-Terminator-Expressionskassette in Vektor 
pUC19 dar 

<400> 17 



ttttggaaat 


gatttgcatg 


gaagccatgt 


gtaaaaccat 


gacatccact 


tggaggatgc 


60 


aataatgaag 


aaaactacaa 


atttacatgc 


aactagttat 


gcatgtagtc 


tatataatga 


120 


ggattttgca 


atactttcat 


tcatacacac 


tcactaagtt 


ttacacgatt 


ataatttctt 


180 


catagccagc 


ggatccgata 


tcgggcccgc 


tagcgttaac 


cctgctttaa 


tgagatatgc 


240 


gagacgccta 


tgatcgcatg 


atatttgctt 


tcaattctgt 


tgtgcacgtt 


gtaaaaaacc 


300 


tgagcatgtg 


tagctcagat 


ccttaccgcc 


ggtttcggtt 


cattctaatg 


aatatatcac 


360 


ccgttactat 


cgtattttta 


tgaataatat 


tctccgttca 


atttactgat 


tgtccgtcga 


420 


gcaaatttac 


acattgccac 


taaacgtcta 


aacccttgta 


atttgttttt' 


gttttactat 


480 


gtgtgttatg 


tatttgattt 


gcgataaatt 


tttatatttg 


gtactaaatt 


tataacacct 


540 


tttatgctaa 


cgtttgccaa 


cacttagcaa 


tttgcaagtt 


gattaattga 


ttctaaatta 


600 


tttttgtctt 


ctaaatacat 


atactaatca 


actggaaatg 


taaatatttg 


ctaatatttc 


660 


tactatagga 


gaattaaagt 


gagtgaatat 


ggtaccacaa 


ggtttggaga 


tttaattgtt 


720 


gcaatgctgc 


atggatggca 


tatacaccaa 


acattcaata 


attcttgagg 


ataataatgg 


780 , 


taccacacaa 


gatttgaggt 


gcatgaacgt 


cacgtggaca 


aaaggtttag 


taatttttca 


840 


agacaacaat 


gttaccacac 


acaagttttg 


aggtgcatgc 


atggatgccc 


tgtggaaagt 


900 


ttaaaaatat 


tttggaaatg 


atttgcatgg 


aagccatgtg 


taaaaccatg 


acatccactt 


960 


ggaggatgca 


ataatgaaga 


aaactacaaa 


tttacatgca 


actagttatg 


catgtagtct 


1020 


atataatgag 


gattttgcaa 


tactttcatt 


catacacact 


cactaagttt 


tacacgatta 


1080 


taatttcttc 


atagccagca 


gatctgccgg 


catcgatccc 


gggccatggc 


ctgctttaat 


1140 


gagatatgcg 


agacgcctat 


gatcgcatga 


tatttgcttt 


caattctgtt 


gtgcacgttg 


1200 


taaaaaacct 


gagcatgtgt 


agctcagatc 


cttaccgccg 


gccucggucc 


accccaauga 


1 0 fin 


atatatcacc 


cgttactatc 


gtatttttat 


gaataatatt 


ctccgttcaa 


tttactgatt 


1320 


gtccgtcgac 


gagctcggcg 


cgccaagctt 


ggcgtaatca 


tggtcatagc 


tgtttcctgt 


1380 


gtgaaattgt 


tatccgctca 


caattccaca 


caacatacga 


gccggaagca 


taaagtgtaa 


1440 


agcctggggt 


gcctaatgag 


tgagctaact 


cacattaatt 


gcgttgcgct 


cactgcccgc 


1500 


tttccagtcg 


ggaaacctgt 


cgtgccagct 


gcattaatga 


atcggccaac 


gcgcggggag 


1560 


aggcggtttg 


cgtattgggc 


gctcttccgc 


ttcctcgctc 


actgactcgc 


tgcgctcggt 


1620 
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cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt tatccacaga 1680 
atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg 1740 
taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa 1800 
eiaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataciagat accaggcgtt 1860 
tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct 1920 
gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct gtaggtatct 1980 
cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc ccgttcagcc 2040 
cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa gacacgactt 2100 
atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg taggcggtgc 2160 
tacagagttc ttgaagtggt ggcctaacta cggctacact agaaggacag tatttggtat 2220 
ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa 2280 
acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta cgcgcagaa,a 2340 
aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc agtggaacga 2400 
aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca cctagatcct 2460 
tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa cttggtctga 2520 
cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat ttcgttcatc 2580 
catagttgcc tgactccccg tcgtgtagat aactacgata cgggagggct taccatctgg 2640 
ccccagtgct gcaatgatac cgcgagaccc acgctcaccg gctccagatt tatcagcaat 2700 
aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat ccgcctccat 2760 
ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta atagtttgcg 2820 
caacgttgtt gccattgcta caggcatcgt ggtgtcacgc tcgtcgtttg gtatggcttc 2880 
attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt tgtgcaaaaa 2940 
agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg cagtgttatc 3000 
act.catggtt atggcagcac tgcataattc tcttactgtc atgccatccg taagatgctt 3060 
ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc ggcgaccgag 3120 
ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca catagcagaa ctttaaaagt 3180 
gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac cgctgttgag 3240 
atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt ttactttcac 3300 
cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg gaataagggc 3360 



gacacggaaa 


tgttgaatac 


tcatactctt 


gggttattgt 


ctcatgagcg 


gatacatatt 


ggttccgcgc 


acatttcccc 


gaaaagtgcc 


gacattaacc 


tataaaaata 


ggcgtatcac 


tgacggtgaa 


aacctctgac 


acatgcagct 


ggatgccggg 


agcagacaag 


cccgtcaggg 


ctggcttaac 


tatgcggcat 


cagagcagat 


aataccgcac 


agatgcgtaa 


ggagaaaata 


•gcgcaactgt 


tgggaagggc 


gatcggtgcg 


agggggatgt 


gctgcaaggc 


gattaagttg 


ttgtaaaacg 


acggccagtg 


aattcggcgc 


ccactaaacg 


tctaaaccct 


tgtaatttgt 


atttgcgata 


aatttttata 


tttggtacta 


ccaacactta 


gcaatttgca 


agttgattaa 


acatatacta 


atcaactgga 


aatgtaaata 


aagtgagtga 


atatggtacc 


acaaggtttg 


ggcatataca 


ccaaacattc 


aataattctt 


aggtgcatga 


acgtcacgtg 


gacaaaaggt 


acacacaagt 


tttgaggtgc 


atgcatggat 


aatgatttgc 


atggaagcca 


tgtgtaaaac 


aagaaaacta 


caaatttaca 


tgcaactagt 


gcaatacttt 


cattcataca 


cactcactaa 


agcccaccgc 


ggtgggcggc 


cgcctgcagt 


cgagacgcct 


atgatcgcat 


gatatttgct 


c ugagca ug u 


g cage u c aga 


cccuuaccgc 


cccgttacta 


tcgtattttt 


atgaataata 


agcaaattta 


cacattgcca 


ctaaacgtct 


tgtgtgttat 


gtatttgatt 


tgcgataaat 


ttttatgcta 


acgtttgcca 


acacttagca 
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cctttttcaa tattattgaa gcatttatca 3420 
tgaatgtatt tagaaaaata aacaaatagg 3480 
acctgacgtc taagaaacca ttattatcat 3540 
gaggcccttt cgtctcgcgc gtttcggtga 3600 
cccggagacg gtcacagctt gtctgtaagc 3660 
cgcgtcagcg ggtgttggcg 'ggtgtcgggg * 3720 
tgtactgaga gtgcaccata tgcggtgtga 3780 
ccgcatcagg cgccattcgc cattcaggct 3840 
ggcctcttcg ctattacgcc agctggcgaa 3900 
ggtaacgcca gggttttccc agtcacgacg 3960 
gccgagctcc tcgagcaaat ttacacattg 4020 
ttttgtttta ctatgtgtgt tatgtatttg 4080 
aatttataac accttttatg ctaacgtttg 4140 
ttgattctaa attatttttg tcttctaaat 4200 
tttgctaata tttctactat aggagaatta 4260 
gagatttaat tgttgcaatg ctgcatggat 4320 
gaggataata ajtggtaccac acaagatttg 4380 
ttagtaattt ttcaagacaa caatgttacc 4440 
gccctgtgga aagtttaaaa atattttgga- 4500 
catgacatcc acttggagga tgcaataatg 4560 
tatgcatgta gtctatataa tgaggatttt 4620 . 
gttttacacg attataattt cttcatagcc 4680 
ctagaaggcc tcctgcttta atgagatatg 4740 
ttcaattctg ttgtgcacgt tgtaaaaaac 4800' 
cggtttcggt tcattctaat geiatatatca 4860 
ttctccgttc aatttactga ttgtccgtcg 4920 
aaacccttgt aatttgtttt tgttttacta 4980 
ttttatattt ggtactaaat ttataacacc 5040 
atttgcaagt tgattaattg attctaaatt 5100 
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atttttgtct tctaaataca tatactaatc 
ctactatagg agaattaaag tgagtgaata 
tgcaatgctg catggatggc atatacacca 
gtaccacaca agatttgagg tgcatgaacg 



aactggaaat gtaaatattt gctaatattt 5160 
tggtaccaca aggtttggag atttaattgt 5220 
aacattcaat aattcttgag gataataatg 5280 
tcacgtggac aaaagcfttta gtaatttttc 5340 



aagacaacaa tgttaccaca cacaagtttt gaggtgcatg catggatgcc ctgtggaaag 5400 
tttaaaaata 5410 

<210> 18 
<211> 648 
<212> DNA 

<213> Phaeodactyluin tricomutum 

<220> 
<221> CDS. 
<222> (1),.(648) 

<220> 
<223> 

<400> 18 

tgg tgg aaa aac aag cac aac gga cac cac gcc gtc ccc aac etc cac 48 
Trp Trp Lys Asn Lys His Asn Gly His His Ala Val Pro Asn Leu His 
1 ' 5 10 ' .15 

tgc tec tec gca gtc gcg caa gat ggg gac ccg gac ate gat ace atg 96 
Cys Ser Ser Ala Val Ala Gin Asp Gly Asp Pro Asp lie Asp Thr Met . 
20 25 . • 30 

ccc ctt etc gcc tgg tec gtc cag caa gee eag tct tac egg gaa etc 144* • 
• Pro Leu Leu Ala Trp. Ser Val Gin Gin Ala Gin Ser Tyr Arg Glu Leu 
^ \ 35 - 40 45 

i . 

caa gcc gac gga aag gat teg ggt ttg gtc aag ttc atg ate cgt aac 192 
Gin Ala Asp Gly Lys Asp Ser Gly Leu Val Lys Phe Met lie Arg Asn 
50 55 60 

caa tec tac ttt tac ttt ccc ate ttg ttg etc gcc cgc ctg teg tgg 240 
Gin Ser Tyr Phe Tyr Phe Pro He Leu Leu Leu Ala Arg Leu Ser Trp 
65 • 70 * 75 80 . 

ttg aac gag tec ttc aag tgc gcc ttt ggg ctt gga get gcg teg gag 288 
Leu Asn Glu Ser Phe Lys Cys Ala Phe Gly Leu Gly Ala Ala Ser Glu 
85 90 95 

aac get get etc gaa etc aag gcc aag ggt ctt cag tac ccc ctt ttg 336 
Asn Ala Ala Leu Glu Leu I^ys Ala Lys Gly Leu Gin Tyr Pro Leu Leu 
100 105 110 

gaa aag get ggc ate ctg ctg cac tac get tgg atg ctt aca gtt teg 384 
Glu Lys Ala Gly He Leu Leu His Tyr Ala Trp Met Leu Thr Val Ser 
115 120 125 
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tec ggc ttt gga cgc ttc teg ttc gcg tac acc gca ttt tac ttt eta 432 
Ser Gly Phe Gly Arg Phe Ser Phe Ala Tyr Thr Ala Phe Tyr Phe Leu 
130 135 140 

ace gcg ace gcg tee tgt gga ttc ttg etc gee att gtc ttt ggc etc 480 
Thr Ala Thr Ala Ser Cys Gly Phe Leu Leu Ala lie Val Phe Gly Leu 
145 150 155 160 

ggc eac aac ggc atg gee acc tac aat gee gae gee cgt ecg gae ttc 528 
Gly His Asn Gly Met Ala Thr Tyr Asn Ala Asp Ala Arg Pro Asp Phe 
165 .170 175 

tgg aag etc caa gtc acc acg act cgc aac gtc acg ggc gga eac ggt 576 
Trp Lys Leu Gin Val Thr Thr Thr Arg Asn Val Tbr Gly Gly His Gly 
180 185 190 

ttc cec caa gee ttt gtc gae tgg ttc tgt ggt ggc etc eag tac caa 624 
• Phe Pro Gin Ala Phe Val Asp Trp Phe Cys Gly Gly Leu Gin Tyr. Gin' 
195 ■ 200 205 . 

gtc gae cae eac tta ttc ccc age 648 
Val Asp His His Leu Phe Pro Ser 
210 . 215 • 



<210> 19 
<211> 216 

<212> PRT . - • 

<213> Phaeodactyluiu tricomutum 

<400> 19 

Trp Trp Lys Asn Lys His Asn Gly His His Ala Val Pro Asn Leu His 
1 5 10 . * . 15 

Cys Ser Ser Ala Val Ala Gin Asp Gly Asp Pro Asp lie Asp Thr' Met 
20 25 30 

Pro Leu Leu Ala Trp Ser Val Gin Gin Ala Gin Ser Tyr Arg Glu Leu 
35 40 i; 45 

Gin Ala Asp Gly Lys Asp Ser Gly Leu Val Lys Phe Met lie Arg Asn 
50 55 • . 60 . 

Gin Ser Tyr Phe Tyr Phe Pro lie Leu Leu Leu Ala Arg Leu Ser Trp 
65 70 * . 75 80 

Leu Asn Glu Ser Phe Lys Cys Ala Phe Gly Leu Gly Ala Ala Ser Glu 
85 90 95 

r • 

Asn Ala Ala Leu Glu Leu Lys Ala Lys Gly Leu Gin Tyr Pro Leu Leu 
100 105 110 

Glu Lys Ala Gly lie Leu Leu His Tyr Ala Trp Met Leu Thr Val Ser 
115 120 125 

Ser Gly Phe Gly Arg Phe Ser Phe Ala Tyr Thr Ala Phe Tyr Phe Leu 
130 135 140 
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Thr Ala Thr Ala Ser Cys Gly Phe Leu Leu Ala lie Val Phe Gly Leu 
145 150 155 , 160 

Gly His Asn Gly Met Ala Thr Tyr Asn Ala Asp Ala Arg Pro Asp Phe 
165 . 170 175 

Trp Lys Leu Gin Val Ihr Thr Thr Arg Asn Val Thr Gly Gly His Gly 
180 , 185 190 

Phe Pro Gin Ala Phe Val Asp Trp Phe Cys Gly Gly Leu Gin Tyr Gin 
195 200 205 

Val Asp His His Leu Phe Pro Ser 
210 215 

'<210> 20 
•<211> 12093 
<212> DNA 
<213> Unknown 

<220> 

<223> pflanzlicher Expressionsvektor mit einer 
Promotor-Terminator-Expressionskassette 



<400> 20 

gatctggcgc cggccagcga 


gacgagcaag 


attggccgcc 


gcccgaaacg 


atccgacagc 


60 


gcgcccagca caggtgcgca 


ggcaaattgc 


accaacgcat 


acagcgccag 


cagaatgcca 


120 


tagtgggcgg tgacgtcgtt 


cgagtgaacc 


agatcgcgca 


ggaggcccgg 


cagcaccggc 


180 


abaatcaggc cgatgccgac 


agcgtcgagc 


gcgacagtgc 


tcagaattac 


gatcaggggt 


240 


atgttgggtt tcacgtctgg 


cctccggacc 


agcctccgct 


ggtccgattg 


aacgcgcgga 


300 


ttctttatca ctgataagtt 


ggtggacata 


ttatgtttat 


cagtgataaa 


gtgtcaagca 


360 


tgacaaagtt gcagccgaat 


acagtgatcc 


gtgccgccct 


ggacctgttg 


aacgaggtcg 


420 


gcgtagacgg tctgacgaca 


cgcaaactgg 


cggaacggtt 


gggggttcag 


cagccggcgc 


480 


tttactggca cttcaggaac 


aagcgggcgc 


tgctcgacgc 


actggccgaa 


gccatgctgg 


540 


cggagaatca tacgcattcg 


gtgccgagag 


ccgacgacga 


ctggcgctca 


tttctgatcg 


600 


ggaatgcccg cagcttcagg 


caggcgctgc 


tcgcctaccg 


cgatggcgcg 


cgcatccatg 


660 


ccggcacgcg accgggcgca 


ccgcagatgg 


aaacggccga 


cgcgcagctt 


cgcttcctct 


720 


gcgaggcggg tttttcggcc 


ggggacgccg 


tcaatgcgct 


gatgacaatc 


agctacttca 


780 


ctgttggggc cgtgcttgag 


gagcaggccg 


•gcgacagcga 


tgccggcgag 


cgcggcggca 


840 


ccgttgaaca ggctccgctc 


tcgccgctgt 


tgcgggccgc 


gatagacgcc 


ttcgacgaag 


900 


ccggtccgga cgcagcgttc 


gagcagggac 


tcgcggtgat 


tgtcgatgga 


ttggcgaaaa 


960 
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ggaggctcgt 


tgtcaggaac 


gttgaaggac 


cgagaaaggg 


tgacgattga 


tcaggaccgc 


1020 


tgccggagcg caacccactc 


actacagcag 


agccatgtag 


acaacatccc 


ctcccccttt 


1080 


ccaccgcgtc 


agacgcccgt 


agcagcccgc 


tacgggcttt 


ttcatgccct 


gccctagcgt 


1140 


ccaagcctca cggccgcgct 


cggcctctct 


ggcggccttc 


tggcgctctt 


ccgcttcctc 


1200 


gctcactgac 


tcgctgcgct 


cggtcgttcg 


gctgcggcga 


gcggtatcag 


ctcactcaaa 


1260 


ggcggtaata 


cggttatcca 


cagaatcagg 


ggataacgca 


ggaaagaaca 


tgtgagcaaa 


1320 


aggccagcaa 


aaggccagga 


accgtaaaaa 


ggccgcgttg 


ctggcgtttt 


tccataggct 


1380 


ccgcccccct 


gacgagcatc 


acaaaaatcg 


acgctcaagt 


cagaggtggc 


gaaacccgac 


1440 


aggactataa 


agataccagg 


cgtttccccc 


tggaagctcc 


ctcgtgcgct 


ctcctgttcc 


1500 


gaccctgccg 


cttaccggat 


acctgtccgc 


ctttctccct 


tcgggaagcg 


tggcgctttt 


1560 


ccgctgcata 


accctgcttc 


ggggtcatta 


tagcgatttt 


ttcggtatat 


ccatcctttt 


1620 


•tcgcacgata 


tacaggattt 


tgccaaaggg 


ttcgtgtaga 


ctttccttgg 


tgtatccaac 


1680 


ggcgtcagcc 


gggcaggata 


ggtgaagtag 


gcccacccgc 


gagcgggtgt 


tccttcttca 


1740 


ctgtccctta 


ttcgcacctg 


gcggtgctca 


acgggaatcc 


tgctctgcga 


ggctggccgg 


1800 


ctaccgccgg 


cgtaacagat 


gagggcaagc 


ggatggctga 


tgaaaccaag 


ccaaccagga 


1860 


agggcagccc 


acctatcaag 


gtgtactgcc 


ttccagacga 


acgaagagcg 


attgaggaaa 


1^20 


a&racggcggc 


ggccggcatg 


agcctgtcgg 


cctacctgct 


ggccgtcggc 


cagggctaca 


1980 


aaatcacggg 


cgtcgtggac 


tatgagcacg 


tccgcgagct 


ggcccgcatc 


aatggcgacc 


2040 


tgggccgcct 


gggcggcctg 


ctgaaactct 


ggctcaccga 


cgacccgcgc 


acggcgcggt 


2100 


tcggtgatgc 


cacgatcctc 


gccctgctgg 


cgaagatcga 


agagaagcag 


gacgagcttg 


2160 


gcaaggtcat 


gatgggcgtg 


gtccgcccga 


gggcagagcc 


atgacttttt 


tagccgctaa 


2220 


aacggccggg 


gggtgcgcgt 


gattgccaag 


cacgtcccca 


tgcgctccat 


caagaagagc 


2280 


gacttcgcgg 


agctggtgaa 


gtacatcacc 


gacgagcaag 


gcaagaccga 


gcgcctttgc 


2340 


gacgctcacc 


gggctggttg 


ccctcgccgc 


tgggctggcg 


gccgtctatg 


gccctgcaaa 


2400 


cgcgccagaa 


acgccgtcga 


agccgtgtgc 


gagacaccgc 


ggccgccggc 


gttgtggata 


2460 


cctqgcggaa 


aacttggccc 


tcactgacag 


atgaggggcg 


gacgttgaca 


cttgaggggc 


2520 


cgactcaccc 


ggcgcggcgt 


tgacagatga 


ggggcaggct 


cgatttcggc 


cggcgacgtg 


2580 


gagctggcca 


gcctcgcaaa 


tcggcgaaaa 


cgcctgattt 


tacgcgagtt 


tcccacagat 


2640 


gatgtggaca 


agcctgggga 


taagtgccct 


gcggtattga 


cacttgaggg 


gcgcgactac 


2700 



tgacagatga ggggcgcgat ccttgacact 
gcacctattg acatttgagg ggctgtccac 
ccgcccgttt ttcggccacc gctaacctgt 
aaaccttgtt tttaaccagg gctgcgccct 
tgccccccct tctcgaaccc tcccggcccg 
tgcgcccctc ggccgcgaac ggcctcaccc 
ttgccgggat cggggcagta acgggatggg 
ttgacgtgcc gcaggtgctg gcatcgacat 
gcggcctggg tggcggcctg cccttcactt 
cggggccggc aatttttacc ttgggcattc 
tgttcggggg tgcgataaac ccagcgaacc 
gtatgaaaac gagaattgga cctttacaga 
ctaccaagac gaagaggatg aagaggatga 
tactgataag ataatatatc ttttatatag 
ggcaaggcat aggcagcgcg cttatcaata 
tgcatggact aatgcttgaa acccaggaca 
attgggtaat gactccaact tattgatagt 
tgtcatgcag ctccaccgat tttgagaacg 
gctgcctcag attcaggtta tgccgctcaa 
gcagctttcc cttcaggcgg gattcataca 
cgtcaaaggg tgacagcagg ctcataagac 
atacgtgcgc aacaaccgtc ttccggagac 
gcgatttagc cccgacatag ccccactgtt 
tgcccggctg tatgcgcgag gttaccgact 
cgtgttgagg ccaacgccca taatgcgggc 
catatcaatg attttctggt gcgtaccggg 
ccatgtttta cggcagtgag agcagagata 
acgcaccacc ccgtcagtag ctgaacagga 
agcacctcaa aaacaccatc atacactaaa 
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tgaggggcag agtgctgaca gatgaggggc 2760 
aggcagaaaa tccagcattt gcaagggttt 2820 
cttttaacct gcttttaaac caatatttat 2880 
gtgcgcgtga ccgcgcacgc cgaagggggg 2940 
ctaacgcggg cctcccatcc ccccaggggc 3000 
caaaaatggc agcgctggca gtccttgcca 3060 
cgatcagccc gagcgcgacg cccggaagca 3120 
tcagcgacca ggtgccgggc agtgagggcg 3180 
cggccgtcgg ggcattcacg gacttcatgg 3240 
ttggcatagt ggtcgcgggt gccgtgctcg 3300 
atttgaggtg ataggtaaga ttataccgag 3360 
attactctat gaagcgccat atttaaaaag 3420 
ggaggcagat tgccttgaat atattgacaa 3480 
aagatatcgc cgtatgtaag gatttcaggg 3540 
tatctataga atgggcaaag cataaaaact 3600 
ataaccttat agcttgtaaa ttctatcata 3660 
gttttatgtt cagataatgc ccgatgactt 3720 
acagcgactt ccgtcccagc cgtgccaggt 3780 
ttcgctgcgt atatcgcttg ctgattacgt 3840 
gcggccagcc atccgtcatc catatcacca 3900 
gccccagcgt cgccatagtg cgttcaccga 3960 
tgtcatacgc gtaaaacagc cagcgctggc 4020 
cgtccatttc cgcgcagacg atgacgtcac 4080 
gcggcctgag ttttttaagt gacgtaaaat 4140 
tgttgcccgg catccaacgc cattcatggc 4200 
ttgagaagcg gtgtaagtga actgcagttg 4260 
gcgctgatgt ccggcggtgc ttttgccgtt 4320 
gggacagctg atagacacag aagccactgg 4380 
tcagtaagtt ggcagcatca cccataattg 4440 



tggtttcaaa atcggctccg tcgatactat 
aaaagctgtt ttctggtatt taaggtttta 
cttgttataa ttagcttctt ggggtatctt 
taaatggcta aaatgagaat atcaccggaa 
gtaaaagata cggaaggaat gtctcctgct 
aacctatatt taaaaatgac ggacagccgg 
gaaaaggaca tgatgctatg gctggaagga 
gaacggcatg atggctggag caatctgctc 
gaagagtatg aagatgaaca aagccctgaa 
aggctctttc actccatcga catatcggat 
ttagccgaat tggattactt actgaataac 
gaagaagaca ctccatttaa agatccgcgc 
cccgaagagg aacttgtctt ttcccacggc 
gatggcaaag taagtggctt tattgatctt 
gacattgcct tctgcgtccg. gtcgatcagg 
ctattttttg acttactggg gatcaagcct 
ctggatgaat tgttttagta cctagatgtg 
caccgacttc ttccgcatca agtgttttgg 
gggcaagggg tcgctggtat tcgtgcaggg 
cggccagacg gtctacggga ccgacttcat 
ggcaccaggc gggtcaaatc aggaataagg 
cccgcaagga gggtgaatga atcggacgtt 
cgacgcgggg ttttccgccg aggatgccga 
gccccgcgaa accttccagt ccgtcggctc 
gcgcgacagc gtgcaactgg ctccccctgc 
ttcgcgtcgt ctcgewicagg aggcggcagg 
aggaactatg acgaccaaga agcgaaaaac ' 
cgaggcc^ag caggccgcgt tgctgaaaca 
ttccttgttc gatattgcgc cgtggccgga 
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gttatacgcc aactttgaaa 


acaactttga 


4500 


gaatgcaagg aacagtgaat 


tggagttcgt 


4560 


taaatactgt agaaaagagg 


aaggaaataa 


4620 


ttgaaaaaac tgatcgaaaa 


ataccgctgc 


4680 


aaggtatata agctggtggg 


agaaaatgaa 


4740 


tataaaggga ccacctatga 


tgtggaacgg 


4800 


aagctgcctg ttccaaaggt 


cctgcacttt 


4860 


atgagtgagg ccgatggcgt 


cctttgctcg 


4920 


aagattatcg agctgtatgc 


ggagtgcatc 


4980 


tgtccctata cgaatagctt 


agacagccgc 


5040 


gatctggccg- atgtggattg 


cgaaaactgg 


5100 


gagctgtatg attttttaaa 


gacggaaiaag 


5160 


gacctgggag acagcaacat 


' ctttgtgaaa 


5220 


gggagaagcg gcagggcgga 


caagtggtat 


5280 


gaggatatcg gggaagaaca 


gtatgtcgag 


5340 


gattgggaga aaataaaata 


ttatatttta 


5400 


gcgcaacgat gpcggcgaca 


agcaggagcg 


5460 


ctctcaggcc gaggcccacg 


gcaagtattt . 


5520 


caagattcgg aataccaagt 


acgagaagga 


5580 


tgccgataag gtggattatc 


tggacaccaa 


5640 


gcacattgcc ccggcgtgag 


tcggggcaat 


5700 


tgaccggaag gcatacaggc 


aagaactgat 


5760 


aaccatcgca agccgcaccg 


tcatgcgtgc 


5820 


gatggtccag caagctacgg 


ccaagatcga 


5880 


cctgcccgcg ccatcggccg 


ccatagagca 


5940 


tttggcgaag tcgatgacca 


tcgacacgcg' 


6000 


cgccggcgag gacctggcaa 


aacaggtcag 


6060 


cacgaagcag cagatcaagg 


aaatgcagct 


6120 


cacgatgcga gcgatgccaa 


acgacacggc 


6180 



ccgctctgcc ctgttcacca cgcgcaacaa gaaaatcccg cgcgaggcgc tgcaaaacaa 6240 
ggtcattttc cacgtcaaca aggacgtgaa gatcacctac accggcgtcg agctgcgggc 6300 
cgacgatgac gaactggtgt ggcagcaggt gttggagtac gcgaagcgca cccctatcgg 6360 
cgagccgatc accttcacgt tctacgagct ttgccaggac ctgggctggt cgatcaatgg 6420 
ccggtattac acgaaggccg aggaatgcct gtcgcgccta caggcgacgg cgatgggctt 6480 
cacgtccgac cgcgttgggc acctggaatc ggtgtcgctg ctgcaccgct tccgcgtcct 6540 
ggaccgtggc aagaaaacgt* cccgttgcca ggtcctgatc gacgaggaaa tcgtcgtgct <6600 
gtttgctggc gaccactaca cgaaattcat atgggagaag taccgcaagc tgtcgccgac 6660 
ggcccgacgg atgttcgact atttcagctc gcaccgggag ccgtacccgc tcaagctgga 6720 
aaccttccgc ctcatgtgcg gatcggattc cacccgcgtg aagaagtggc gcgagcaggt 6780 
cggcgaagcc tgcgaagagt tgcgaggcag cggcctggtg gaacacgcct gggtcaatga 6840 
tgacctggtg cattgcaaac gctagggcct tgtggggtca gttccggctg ggggttcagc 6900 
agccagcgct ttactggcat ttcaggaaca agcgggcact gctcgacgca cttgcttcgc 6960 
tcagtatcgc tcgggacgca cggcgcgctc tacgaactgc cgataaacag aggattaaaa 7020- 
ttgacaattg- tgattaaggc tcagattcga cggcttggag cggccgacgt gcaggatttc 7080 
cgcgagatcc gattgtcggc cctgaagaaa gctccagaga tgttcgggtc cgtttacgag 7140 
cacgaggaga aaaagcccat ggaggcgttc gctgaacggt tgcgagatgc cgtggcattc 7200 
ggcgcctaca tcgacggcga gatcattggg ctgtcggtct tcaaacagga ggacggcccc 7260 
aaggacgctc acaaggcgca tctgtccggc gttttcgtgg agcccgaaca gcgaggccga 7320 
ggggtcgccg gtatgctgct gcgggcgttg ccggcgggtt tattgctcgt gatgatcgtc 7380 
cgacagattc caacgggaat ctggtggatg cgcatcttca tcctcggcgc acttaatatt 7440. 
tcgctattct ggagcttgtt gtttatttcg gtctaccgcc tgccgggcgg ggtcgcggcg 7500 
acggtaggcg ctgtgcagcc gctgatggtc gtgttcatct ctgccgctct gctaggtagc 7560 
ccgatacgat tgatggcggt cctgggggct atttgcggaa ctgcgggcgt ggcgctgttg 7620 
gtgttgacac caaacgcagc gctagatcct gtcggcgtcg cagcgggcct ggcgggggcg 7680 
gtttccatgg cgttcggaac cgtgctgacc cgcaagtggc aacctcccgt gcctctgctc 7740 
acctttaccg cctggcaact ggcggccgga ggacttctgc tcgttccagt agctttagtg 7800 
tttgatccgc caatcccgat gcctacagga accaatgttc tcggcctggc gtggctcggc 7860 
ctgatcggag cgggtttaac ctacttcctt ' tggttccggg ggatctcgcg actcgaacct 7920 
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acagttgttt ccttactggg ctttctcagc 
catcaggccg acagtcggaa cttcgggtcc 
aggggcigttg atatcgtcaa cgttcacttc 
cggctttatc cagcgatttc ctattatgtc 
cggttaagcg agaaatgaat aagaaggctg 
tttgatcaca ggcagcaacg ctctgtcatc 
tcatccgtgt t.tcaaacccg gcagcttagt 
gagcaaagtc tgccgcctta caacggctct 
gcctgtatcg agtggtgatt ttgtgccgag 
•tggcaggata tattgtggtg taaacaaatt 
gacgttttta atgtactggg gtggtttttc 
tgcccttcac cgcctggccc tgagagagtt 
gcaggcgaaa atcctgtttg atggtggttc 
agaatagccc gagatagggt tgagtgttgt 
gaacgtggac tccaacgtca aagggcgaaa 
tgaaccatca cccaaatcaa gttttttggg 
ccctaa'aggg agcccccga't ttagagcttg 
ggaSigggaag aaagcgaaag gagcgggcgc 
gatcggtgcg . ggcctcttcg ctattacgcc 
gattaagttg ggtaacgcca gggttttccc 
aatt.aattcc- catcttgaaa gaaatatagt 
ggtattatag tccaagcaaa aacataaatt 
tcaataactg attatatcag ctggtacatt 
tgtgtaatac ataaattgat gatatagcta 
agcttgggtc ccgctcagaa gaactcgtca 
tcgggagcgg cgataccgta aagcacgagg 
tcagcaatat cacgggtagc caacgctatg 
ccacagtcga tgaatccaga aaagcggcca 
tcgccatggg tcacgacgag atcctcgccg 



cccagatctg 


gggtcgatca 


gccggggatg 


7980 


ccgacctgta 


ccattcggtg 


agcaatggat 


8040 


taaagaaata 


gcgccactca 


gcttcctcag 


8100 


ggcatagttc 


tcaagatcga 


cagcctgtca 


8160 


ataattcgga 


tctctgcgag 


ggagatgata 


8220 


gttacaatca 


acatgctacc 


ctccgcgaga 


8280 


tgccgttctt 


ccgaatagca 


tcggtaacat 


8340 


cccgctgacg 


ccgtcccgga 


ctgatgggct 


8400 


ctgccggtcg 


gggagctgtt 


ggctggctgg 


8460 


gacgcttaga 


caacttaata 


acacattgcg 


8520 


ttttcaccag 


tgagacgggc 


aacagctgat 


8580 


gcagcaagcg 


gtccacgctg 


gtttgcccca 


8640 


cgaaatcggc 


aaaatccctt 


ataaatcaaa 


8700 


tccagtttgg 


aacaagagtc 


cactattaaa 


8760 


aaccgtctat 


cagggcgatg 


gcccactacg 


8820 


gtcgaggtgc 


cgtaaagcac 


taaatcggaa * 


8880 


acggggaaag 


ccggcgaacg 


tggcgagaaa 


8940 


cattcaggct 


gcgcaactgt 


tgggaagggc 


9000 


agctggcgaa 


agggggatgt 


gctgcaaggc 


9060 


agtcacgacg 


ttgtaaaacg 


acggccagtg 


9120 


ttaaatattt 


attgataaaa 


taacaagtca 


9180 


tattgatgca 


agtttaaatt 


cagaaatatt 


9240 


gccgtagatg, 


aaagactgag 


tgcgatatta 


9300 


gcttagctca 


tcgggggatc 


cgtcgaagct 


9360 


eiyeieigycgciw 




^wy^ w eg ClCl 




aagcggtcag 


cccattcgcc 


gccaagctct 


9480 


tcctgatagc 


ggtccgccac 


acccagccgg 


9540 


ttttccacca 


tgatattcgg 


caagcaggca 


9600 


tcgggcatgc 


gcgccttgag 


cctggcgaac 


9660 
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agttcggctg gcgcgagccc ctgatgctct tcgtccagat catcctgatc gacaagaccg 9720 
gcttccatcc gagtacgtgc tcgctcgatg cgatgtttcg cttggtggtc gaatgggcag 9780 
gtagccggat caagcgtatg cagccgccgc attgcatcag ccatgatgga tactttctcg 9840 
gcaggagcaa ggtgagatga caggagatcc tgccccggca cttcgcccaa tagcagccag 9900 
tcccttcccg cttcagtgac aacgtcgagc acagctgcgc aaggaacgcc cgtcgtggcc 9960 
agccacgata gccgcgctgc ctcgtcctgc agt teat tea gggcaccgga caggtcggtc 10020 
ttgacaaaaa gaaccgggcg cccctgcgct gacagccgga acacggcggc atcagagcag 10080 
ccgattgtct gttgtgccca gtcatagccg aatagcctct ccacccaagc ggccggagaa 10140 
cctgcgtgca atccatcttg ttcaatccaa .gctcccatgg gccctcgact agagtcgaga 10200 
tctggattga gagtgaatat gagactctaa- ttggataccg aggggaattt atggaacgtc 102 60 
agtggagcat ttttgacaag aaatatttgc tagctgatag tgaccttagg cgacttttga 10320 
acgcgcaata atggtttctg acgtatgtgc ttagctcatt aaactccaga aacccgcggc 10380 
tgagtggctc cttcaacgtt gcggttctgt cagttccaaa cgtaaaacgg cttgtcccgc 10440 
gtcatcggcg ggggtcataa cgtgactccc ttaattctcc gctcatgatc ttgatcccct 10500 
gcgccatcag atccttggcg gcaagaaagc catccagttt actttgcagg gcttcccaac^ 10560 
cttaccagag ggcgccccag ctggcaattc cggttcgctt gctgtccata aaaccgccca 10620 
gtctagctat' cgccatgtaa gcccactgca agctacctgc tttctctttg cgcttgcgtt 10680 
ttcccttgtc cagatagccc agtagctgac attcatccgg ggtcagcacc gtttctgcgg 10740 
actggctttc tacgtgttcc gcttccttta gcagcccttg cgccctgagt gcttgcggca 10800" 
gcgtgaagct tgcatgcctg caggtcgacg gcgcgccgag ctcctcgagc aaatttacac 10860 
attgccacta aacgtctaaa cccttgtaat ttgtttttgt tttactatgt gtgttatgta 10920 
tttgatttgc gataaatttt tatatttggt actaaattta taacaccttt tatgctaacg 10980 
tttgccaaca cttagcaatt tgcaagttga ttaattgatt ctaaattatt tttgtcttct 11040 
aaatacatat actaatcaac tggaaatgta aatatttgct aatatttcta ctataggaga 11100 
attaaagtga gtgaatatgg taccaceiagg tttggagatt taattgttgc aatgctgcat 11160 
ggatggcata tacaccaaac attcaataat tcttgaggat aataatggta ccacacaaga 11220 
tttgaggtgc atgaacgtca cgtggacaaa aggtttagta atttttcaag acaacaatgt 11280 
taccacacac aagttttgag gtgcatgcat ggatgccctg tggaaagttt aaaaatattt 11340. 
tggaaatgat ttgcatggaa gccatgtgta aaaccatgac atccacttgg aggatgcaat 11400 
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aatgaagaaa actacaaatt tacatgcaac tagttatgca tgtagtctat ataatgagga 11460 
ttttgcaata ctttcattca tacacactca ctaagtttta cacgattata atttcttcat 11520 
agccagccca ccgcggtggg cggccgcctg cagtctagaa ggcctcctgc tttaatgaga 11580 
tatgcgagac gcctatgatc gcatgatatt tgctttcaat tctgttgtgc acgttgtaaa 11640 
aaacctgagc atgtgtagct cagatcctta ccgccggttt cggttcattc taatgaatat 11700 
atcacccgtt actatcgtat ttttatgaat aatattctcc gttcaattta ctgattgtcc 11760 
gtcgacgaat tcgagctcgg cgcgcctcta gaggatcgat gaattcagat cggctgagtg 11820 
gctccttcaa cgttgcggtt ctgtcagttc caaacgtaaa acggcttgtc, ccgcgtcatc 11880 
ggcgggggtc ataacgtgac tcccttaatt ctccgctcat gatcagattg tcgtttcccg 11940 
ccttcagttt aaactatcag tgtttgacag gatatattgg cgggtaaacc taagagaaaa 12000 
gagcgtttat tagaataatc ggatatttaa aagggcgtga aaaggtttat ccttcgtcca 12060 
tttgtatgtg catgccaacc acagggttcc cca 12093 

<210> 21 
<211> 12085 
<212> DNA 
<213> Unknown . 

<220> 

<223> pflanzlicher Expressionsvektor mit einer 
Promotor-Terminator-B3q)ressionskassette. 

<400> 21 

gatctggcgc cggccagcga gacgagcaag 
gcgcccagca caggtgcgca ggcaaattgc 
tagtgggcgg. tgacgtcgtt cgagtgaacc 
ataatcaggc cgatgccgac agcgtcgagc 
atgttgggtt tcacgtctgg cctccggacc 
ttctttatca ctgataagtt ggtggacata 
tgacaaagtt gcagccgaat acagtgatcc 
gcgtagacgg tctgacgaca cgcaaactgg 
tttactggca cttcaggaac aagcgggcgc 
cggagaatca tacgcattcg gtgccgagag 
ggaatgcccg cagcttcagg caggcgctgc 



attggccgcc 


gcccgaaacg atccgacagc 


60 


accaacgcat 


acagcgccag cagaatgcca 


120 


agatcgcgca 


ggaggcccgg cagcaccggc 


180 


gcgacagtgc 


tcagaattac gatcaggggt 


240 


agcctccgct 


ggtccgattg aacgcgcgga 


300- 


ttatgtttat 


cagtgataaa gtgtcaagca 


360 


gtgccgccct 


ggacctgttg aacgaggtcg 


420 


cggaacggtt 


gggggttcag cagccggcgc 


480 


tgctcgacgc 


actggccgaa gccatgctgg 


540 


ccgacgacga 


ctggcgctca tttctgatcg 


600 


tcgcctaccg 


cgatggcgcg cgcatccatg 


660 



ccggcacgcg accgggcgca ccgcagatgg 
gcgaggcggg tttttcggcc ggggacgccg 
ctgttggggc cgtgcttgag gagcaggccg 
ccgttgaaca ggctccgctc tcgccgctgt 
ccggtccgga cgcagcgttc gagcagggac 
ggaggctcgt tgtcaggaac gttgaaggac 
tgccggagcg caaicccactc actacagcag 
ccaccgcgtc agacgcccgt agcagcccgc 
ccaagcctca cggccgcgct cggcctctct 
gctcactgac tcgctgcgct cggtcgttcg 
ggcggtaata cggttatcca cagaatcagg 
aggccagcaa aaggccagga accgtaaaaa 
ccgcccccct gacgagcatc acaaaaatcg 
aggactataa agataccagg cgtttccccc 
gaccctgccg cttaccggat acctgtccgc 
ccgctgcata accctgcttq ggggtcatta 
tcgcacgata tacaggattt tgccaaaggg 
ggcgtcagcc gggcaggata ggtgaagtag 
ctgtccctta ttcgcacctg gcggtgctca 
ctaccgccgg cgtaacagat gagggcaagc 
agggcagccc acctatcaag gtgtactgcc 
aggcggcggc ggccggcatg agcctgtcgg 
aaatcacggg cgtcgtggac tatgagcacg 
tgggccgcct gggcggcctg ctgaaactct 
tcggtgatgc cacgatcctc gccctgctgg 
gcaaggtcat gatgggcgtg gtccgcccga 
aacggccggg gggrtgcgcgt gattgccaag 
gacttcgcgg agctggtgaa gtacatcacc 
gacgctcacc gggctggttg ccctcgccgc 



47. 

aaacggccga cgcgcagctt cgcttcctct 720 
tcaatgcgct gatgacaatc agctacttca 780 
gcgacagcga tgccggcgag cgcggcggca 840 
tgcgggccgc gatagacgcc ttcgacgaag 900 
tcgcggtgat tgtcgatgga ttggcgaaaa 960 
cgagaaaggg tgacgattga tcaggaccgc 1020 
agccatgtag acaacatccc ctcccccttt 1080 
tacgggcttt ttcatgccct gccctagcgt 1140 
ggcggccttc tggcgctctt ccgcttcctc 1200 
gctgcggcga gcggtatcag ctcactcaaa 1260 
ggataacgca ggaaagaaca tgtgagcaaa 1320 
ggccgcgttg ctggcgtttt tccataggct 1380 
acgctcaagt cagaggtggc gaaacccgac 1440 
tggaagctcc ctcgtgcgct ctcctgttcc 1500 
ctttctccct tcgggaagcg tggcgctttt 1560 
tagcgatttt ttcggtatat ccatcctttt 1620 
ttcgtgtaga ctttccttgg tgtatccaac 1680 
gcccacccgc gagcgggtgt tccttcttca 1740 
acgggaatcc tgctctgcga ggctggccgg 1800 
ggatggctga tgaaaccaag ccaaccagga 1860 
ttccagacga acgaagagcg attgaggaaa 1920 
cctacctgct ggccgtcggc cagggcjbaca 1980 
tccgcgagct ggcccgcatc aatggcgacc 2040 
ggctcaccga cgacccgcgc acggcgcggt 2100 
cgaagatcga agagaagcag gacgagcttg 2160 
gggcagagcc atgacttttt tagccgctaa 2220 
cacgtcccca tgcgctccat caagaagagc 2280 
gacgagcaag gcaagaccga gcgcctttgc 2340 
tgggctggcg gccgtctatg gccctgcaaa 2400 
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cgcgccagaa acgccgtcga agccgtgtgc gagacaccgc ggccgccggc gttgtggata 2460 
cctcgcggaa aacttggccc tcactgacag atgaggggcg gacgttgaca cttgaggggc 2520 
cgactcaccc ggcgcggcgt tgacagatga ggggcaggct cgatttcggc cggcgacgtg 2580 
gagctggcca gcctcgcaaa tcggcgaaaa cgcctgattt tacgcgagtt tccbacagat 2640 
gatgtggaca agcctgggga taagtgccct gcggtattga cacttgaggg gcgcgactac 2700 
tgacagatga ggggcgcgat ccttgacact tgaggggcag agtgctgaca gatgaggggc 2760 
gcacctattg acatttgagg ggctgtccac aggcagaaaa tccagcattt gcaagggttt 2820 
ccgcccgttt ttcggccacc gctaacctgt cttttaacct gcttttaaac caatatttat 2880 
aaaccttgtt tttaaccagg gctgcgccct gtgcgcgtga ccgcgcacgc cgaagggggg 2940 
tgccccccct tctcgaaccc tcccggcccg ctaacgcggg cctcccatcc ccccaggggc 3000 
tgcgcccctc .ggccgcgaac ggcctcaccc caaaaatggc agcgctggca gtccttgcca 3060 
ttgccgggat cggggcagta acgggatggg . cgatcagccc gagcgcgacg cccggaagca 3120 
ttgacgtgcc gcaggtgctg gcatcgacat tcagcgacca ggtgccgggc agtgagggcg 3180 
gcggcctggg tggcggcctg cccttcactt cggccgtcgg ggcattcacg gacttcatgg 3240 
cggggccggc aatttttacc ttgggcattc ttggcatagt ggtcgcgggt gccgtgctcg 3300 
tgttcggggg tgcgataaac ccagcgaacc atttgaggtg ataggtaaga ttataccgag 3360 
gtatgaaaac gagaattgga cctttacaga attactctat gaagcgccat atttaaaaag 3420 
ctaccaagac gaagaggatg aagaggatga ggaggcagat tgccttgaat atattgacaa 3480 
tactgataag ataatatatc ttttabatag aagatatcgc cgtatgtaag gatttcaggg 3540 
ggcaaggcat aggcagcgcg cttatcaata tatctataga atgggcaaag cataaaaact 3600 
tgcatggact aatgcttgaa acccaggaca ataaccttat agcttgtaaa ttctatcata 3660 
attgggtaat gactccaact tattgatagt gttttatgtt cagataatgc ccgatgactt 3720 
tgtcatgcag ctccaccgat tttgagaacg acagcgactt ccgtcccagc cgtgccaggt 3780 
gctgcctcag attcaggtta tgccgctcaa ttcgctgcgt atatcgcttg ctgattacgt 3840 
gcagctttcc cttcaggcgg gattcataca gcggccagcc atccgtcatc catatcacca 3900 
cgtcaaaggg tgacagcagg ctcataagac gccccagcgt cgccatagtg cgttcaccga 3960 
atacgtgcgc aacaaccgtc ttccggagac tgtcatacgc gtaaaacagc cagcgctggc 4020 
gcgatttagc cccgacatag ccccactgtt cgtccatttc cgcgcagacg atgacgtcac 4080 
tgcccggctg tatgcgcgag* gttaccgact gcggcctgag ttttttaagt gacgtaaiaat 4140 



cgtgttgagg ccaacgccca taatgcgggc 
catatcaatg attttctggt gcgtaccggg 
ccatgtttta cggcagtgag agcagagata 
acgcaccacc ccgtcagtag ctgaacagga 
agcacctcaa aaacaccatc atacactaaa 
tggtttcaaa atcggctccg tcgatactat 
aaaagctgtt ttctggtatt taaggtttta 
cttgttataa ttagcttctt ggggtatctt 
.taaatggcta aaatgagaat atcaccggaa 
gtaaaagata cggaaggaat gtctcctgct 
eiacctatatt taaaaatgac ggacagccgg 
gaaaaggaca tgatgctatg gctggaagga 
gaacggcatg atggctggag caatctgctc 
gaagagtatg aagatgaaca aagccctgaa 
aggctctttc actccatcga catatcggat 
ttagccgaat tggattactt actgaataac 
gaagaagaca ctccatttaa agatccgcgc 
cccgaagagg aacttgtctt ttcccacggc 
gatggcaaag 'taagtggctt tattgatctt 
gacattgcct tctgcgtccg gtcgatcagg 
ctattttttg acttactggg gatcaagcct 
ctggatgaat tgttttagta cctagatgtg 
caccgacttc ttccgcatca agtgttttgg 
gggcaagggg tcgctggtat tcgtgcaggg 
cggccagacg gtctacggga ccgacttcat 
ggcaccaggc gggtcaaajtc aggaataagg 
cccgcaagga gggtgaatga atcggacgtt 
cgacgcgggg ttttccgccg aggatgccga 
gccccgcgaa accttccagt ccgtcggctc 
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tgttgcccgg catccaacgc cattcatggc 4200 
ttgagaagcg gtgtaagtga actgcagttg 4260 
gcgctgatgt ccggcggtgc ttttgccgtt 4320 
gggacagctg atagacacag aagccactgg 4380 
tcagtaagtt ggcagcatca cccataattg 4440 
gttatacgcc aactttgaaa acaactttga 4500 
gaatgcaagg aacagtgaat tggagttcgt 4560 
taaatactgt agaaaagagg aaggaaataa 4620 
ttgaaaaaac tgatcgaaaa ataccgctgc 4680 
aaggtatata agctggtggg agaaaatgaa 4740 
tataaaggga ccacctatga tgtggaacgg 4800 
aagctgcctg ttccaaaggt cctgcacttt 4860 
atgagtgagg ccgatggcgt cctttgctcg 4920 
aagattatcg agctgtatgc ggagtgcatc 4980 
tgtccctata cgaatagctt agacagccgc 5040 
gatctggccg atgtggattg cgaaaactgg 5100 
gagctgtatg attttttaaa gacggaaaag 5160 
gacctgggag acagcaacat ctttgtgaaa 5220 
gggdgaagcg gcagggcgga caagtggtat 5280 
gaggatatcg gggaagaaca gtatgtcgag 5340 
gattgggaga aaataaaata ttatatttta 5400 
gcgcaacgat gccggcgaca agcaggagcg 5460 
ctctcaggcc gaggcccacg gcaagtattt 5520 
caagattcgg aataccaagt acgagaagga 5580 
tgccgataag gtggattatc tggacaccaa 5640 
gcacattgcc ccggcgtgag tcggggcaat 5700 
tgaccggaag gcatacaggc aagaactgat 5760 
ciaccatcgca agccgcaccg tcatgcgtgc 5820 
gatggtccag caagctacgg ccaagatcga 5880 
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gcgcgacagc 


gtgcaactgg 


ctccccctgc 


cctgcccgcg 


ccatcggccg 


ccgtggagcg 




ttcgcgtcgt 


ctcgaacagg 


aggcggcagg 


tttggcgaag tcgatgacca 


tcgacacgcg 


ouuu 


aggaactatg 


acgaccaaga 


agcgaaaaac 


cgccggcgag gacctggcaa 


aacaggtcag 


oOou 


cgaggccaag 


caggccgcgt 


tgctgaaaca 


cacgaagcag cagatcaagg 


aaatgcagct 


6120 


ttccttgttc 


gatattgcgc 


cgtggccgga 


cacgatgcga 


gcgatgccaa 


acgacacggc 


fi on 


ccgctctgcc 


ctgttcacca 


cgcgca.acaa 


gaaaatcccg cgcgaggcgc 


tgcaaaacaa 


6240 


ggtcattttc 


cacgtcaaca 


aggacgtgaa 


gatcacctac 


accggcgtcg 


agctgcgggc 


A A 

6300 


cgacgatgac 


gaactgsrtgt 


ggcagcaggt 


crtliGrcraQtac 


gcgaagcgca 


cccctatcgg 


6360 


cgagccgatc 


accttcacgt 


tctacgagct 


1 1 crc c aCTcrac 

W ^ w y Vrf 


G t crcrcf c t QCf t 


cgatcaatgg 


^ il O A 

6420 


ccggtattac 


acgaaggccg 


aggaatgcct 




wc*y y wy Awy y 


cgatgggctt 


6480 


cacgtccgac 


cgcgttgggc 


acctggaatc 


rrfrt" fit" r" crc trr 
y y wy uvy «»y 


CtCTCaCCCfCfc 
w s*y wcfcwwy w ^ 


tccgcgtcct 


6540 


ggaccgtggc 


aagaaaacgt 


cccgttgcca 


yy i*yc*^v« 


craccracTGraaa 

\j W^ S3 9 SWMi* 


tcgtcgtgct* 


A A 

6600 


gtttgctggc 


gaccactaca 


cgaaattcat 


c* y y CLy cLciy 


VvCLwwy woiqy w 


tgtcgccgac 


6660 


ggcccgacgg 


atgttcgact 


atttcagctc 


y woLw^yyy M^y 


r* ecrt accccrc 

wwy wcLwwwy w 


tcaagctgga 


6720 


aaccttccgc 


ctcatgtgcg 


gatcggattc 


wciccc-y^y uy 


aciycLeLy uyy w 


gcgagcaggt 


6780 


cggcgaagcc 


tgcgaiagagt 


tgcgaggcag 


cyy WW i^y y (-y 


y ctcLwcLwy ww 


gggtcaatga 


6840 


tgacctggtg 


cattgcaaac 


gctagggcct. 


uguyggguca 




ggggttcagc . 


6900 


agccagcgct 


ttactggcat 


ttcaggaaca 


agcgggcac 


y w ^ wy ciwy wa 


cttgcttcgc 


6960 


tcagtatcgc 


tcgggacgca 


cggcgcgctc 


uacgaac eg c 


cgauaaacag 


aggattaaaa 


7020 


ttgacaattg 


tgattaaggc 


tcagattcga 


cggcttggag 


cggccgacgt 


gcaggatttc 


70-80 


cgcgagatcc 


gattgtcggc 


cctgaagaaa 


gctccagaga 


tgttcgggtc 


cgtttacgag 


7140 


cacgaggaga 


aaaagcccat 


ggaggcgttc 


gctgaacggt 


tgcgagatgc 


cgtggcattc 


7200 


ggcgcctaca 


tcgacggcga 


gatcattggg 


ctgtcggtct 


tcaaacagga 


ggacggcccc 


7260/ 


aaggacgctc 


acaaggcgca 


tctgtccggc 


gttttcgtgg 


agcccgaaca 


gcgaggccga 


7320 


ggggtcgccg 


gtatgctgct 


gcgggcgttg 


ccggcgggtt 


tattgctcgt 


gatgatcgtc 


7380 


cgacagattc 


caacgggaat 


ctggtggatg 


cgcatcttca 


tcctcggcgc 


acttaatatt 


7440 


tcgctattct 


ggagcttgtt 


gtttatttcg 


gtctaccgcc 


tgccgggcgg 


ggtcgcggcg 


7500 


acggtaggcg 


ctgtgcagcc 


gctgatggtc 


gtgttcatct 


ctgccgctct 


gctaggtagc 


7560 


ccgatacgat 


tgatggcggt 


cctgggggct 


atttgcggaa 


ctgcgggcgt 


ggcgctgttg 


7620 



gtgttgacac caaacgcagc gctagatcct 
gtttccatgg cgttcggaac cgtgctgacc 
acctttaccg cctggcaact ggcggccgga 
tttgatccgc caatcccgat gcctacagga 
ctgatcggag cgggtttaac ctacttcctt 
acagttgttt ccttactggg ctttctcagc 
catcaggccg acagtcggaa cttcgggtcc 
aggggagttg atatcgtcaa cgttcacttc 
cggctttatc cagcgatttc ctattatgtc 
cggttaagcg agaaatgaat aagaaggctg 
tttgatcaca ggcagcaacg ctctgtcatc 
tcatccgtgt ttcaaacccg gcagcttagt 
gagcaaagtc tgccgcctta caacggctct 
gcctgtatcg agtggtgatt ttgtgccgag 
tggcaggata tattgtggtg taaacaaatt 
gacgttttta atgtactggg gtggtttttc 
tgcccttcac cgcctggccc tgagagagtt 
gcaggcgaaa atcctgtttg atggtggttc 
agaatagccc gagatagggt tgagtgttgt 
gaacgtggac bccaacgtca aagggcgaaa 
tgaaccatca cccaaatcaa gttttttggg 
ccctaaaggg agcccccgat ttagagcttg 
ggaagggaag aaagcgaaag gagcgggcgc 
gatcggtgcg ggcctcttcg ctattacgcc 
gattaagttg ggtaacgcca gggttttccc 
aattaattcc catcttgaaa gaaatatagt 
ggtattatag tccaagcaaa aacataaatt 
tcaataactg attatatcag ctggtacatt 
tgtgtaatac ataaattgat gatatagcta. 
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gtcggcgtcg cagcgggcct ggcgggggcg 7680 
cgcaagtggc aacctcccgt gcctctgctc 7740 
ggacttctgc tcgttccagt agctttagtg 7800 
accaatgttc tcggcctggc gtggctcggc 7860 
tggttccggg ggatctcgcg actcgaacct 7920 
cccagatctg gggtcgatca gccggggatg 7980 
ccgacctgta ccattcggtg agcaatggat 8040 
taaagaaata gcgccactca gcttcctcag 8100 
ggcatagttc tcaagatcga cagcctgtca 8160 
ataattcgga tctctgcgag ggagatgata 8220 
gttacaatca acatgctacc ctccgcgaga 8280 
tgccgttctt ccgaatagca tcggtaacat 8340 
cccgctgacg ccgtcccgga ctgatgggct 8400 
ctgccggtcg.gggagctgtt ggctggctgg 8460 
gacgcttaga caacttaata acacattgcg 8520 
ttttcaccag tgagacgggc aacagctgat 8580 
gcagcaagcg gtccacgctg gtttgcccca 8640 
cgaaatcggc aaaatccctt ataaatcaaa 8700 
tccagtttgg aacaagagtc cactattaaa 8760 
aaccgtctat cagggcgatg gcccactacg 8820 
gtcgaggtgc cgtaaagcac taaatcggaa 8880 
acggggaaag ccggcgaacg tggcgagaaa 8940 
cattcaggct gcgcaactgt tgggaagggc 9000 
agctggcgaa agggggatgt gctgcaaggc 9060 
agtcacgacg ttgtaaaacg acggccagtg 9120 
ttaaatattt attgataaaa taacaagtca 9180 
tattgatgca agtttaaatt .cagaaatatt 9240 
gccgtagatg aaagactgag tgcgatjatta 9300 
gcttagctca tcgggggatc cgtcgaagct 9360 
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agcttgggtc 


ccgctcagaa gaactcgtca 


agaaggcgat 


agaaggcgat 


gcgctgcgaa 


9420 


tcgggagcgg 


cgataccgta aagcacgagg 


aagcggtcag 


cccattcgcc 


gccaagctct 


S480 


tcagcaatat 


cacgggtagc caacgctatg 


tcctgatagc 


ggtccgccac 


acccagccgg 


9540 


ccacagtcga 


tgaatccaga aaagcggcca 


ttttccacca 


tgatattcgg 


caagcaggca 


9600 


tcgccatggg 


tcacgacgag atcctcgccg 


tcgggcatgc 


gcgccttgag 


cctggcgaac 


9660 


agttcggctg 


gcgcgagccc ctgatgctct 


tcgtccagat 


catcctgatc 


gacaagaccg 


9720 


gcttccatcc 


gagtacgtgc tcgctcgatg 


cgatgtttcg 


cttggtggtc 


gaatgggcag 


9780 


gtagccggat 


caagcguacg 


^cciy ccy c eye 


attgcatcag 


ccatgatgga 


tactttctcg 


9840 


gcaggagcaa 


y y ugciy <x a. 


k<» ciy y ciy CL u ^ ^ 


tgccccggca 


cttcgcccaa 


tagcagccag 


9900 


tcccttcccg 


c u b Cay by^cic 


ciciwy Qcyay 


acagctgcgc 


aaggaacgcc 


cgtcgtggcc 


9960 


agccacgata 


gccgcgc ugc 


cucgccc cgc 


agttcattca 


gggcaccgga 


cagsftcggtc 


10020 


ttgacaaaaa 


gaac cgggc g 


ccccugcgcu 


gacagccgga 


acacggcggc 


atcagagcag 


10080 


ccgattgtct 


gccgcgccca 


gccacagccg 


aatagcctct 


ccacccaagc 


ggccggagaa 


10140 


cctgcgtgca 


acccaccuug 


cccaauccaa 


gctcccatgg 


gccctcgact 


agagtcgaga 


10200 


tctggattga 


gagt:gaatiat 


gagac t c t aa 


ttggataccg 


aggggaattt 


atggeiacgtc 


10260 


agtggagcat 


ttzttgacaag 


aaatattztgc 


tagctgatag 


tgaccttagg 


cgacttttga 


10320 


acgcgcaata 


atggtttctg 


acgtatgtgc 


ttagctcatt 


aaactccaga 


aacccgcggc 


10380 


tgagtggctc 


cttcaacgtt 


gcggttctgt 


cagttccaaa 


cgtaaaacgg 


cttgtcccgc 


10440 


gtcatcggcg 


ggggtcataa 


cgtgactccc 


ttaattctcc 


gctcatgatc 


ttgatcccct 


10500 


gcgccatcag 


atccttggcg 


gcaagaaagc 


catccagttt 


actttgcagg 


gcttcccaac 


10560 


cttaccagag 


ggcgccccag 


ctggcaattc 


cggttcgctt 


gctgtccata 


aaaccgccca 


106.20 


gtctagctat 


cgccatgtaa 


gcccactgca 


agctacctgc 


tttctctttg 


cgcttgcgtt 


10680 


ttcccttgtc 


cagatagccc 


agtagctgac 


attcatccgg 


ggtcagcacc 


gtttctgcgg 


107*40 


-actggctttc 


tacgtgttcc 


gcttccttta 


gcagcccttg 


cgccctgagt 


gcttgcggca 


10800 


gcgtgaagct 


tgcatgcctg 


caggtcgacg 


gcgcgccgag 


ctcctcgagc 


aaatttacac 


10860 


attgccacta 


aacgtctaaa 


cccttgtaat 


ttgtttttgt 


tttactatgt 


gtgttatgta 


10920 


tttgatttgc 


gataaatttt 


tatatttggt 


actaaattta 


taacaccttt 


tatgctaacg 


10980 


tttgccaaca 


cttagcaatt 


tgcaagttga 


ttaattgatt 


ctaaattatt 


t'ttgtcttct 


11040 


aaatacatat 


actaatcaac 


tggaaatgta 


aatatttgct 


aatatttcta 


ctataggaga 


11100 
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attaaagtga gtgaatatgg taccacaagg tttggagatt taattgttgc aatgctgcat 11160 
ggatggcata tacaccaaac attcaataat tcttgaggat aataatggta ccacacaaga 11220 
tttgaggtgc atgaacgtca cgtggacaaa aggtttagta atttttcaag acaacaatgt 11280 
taccacacac aagttttgag gtgcatgcat ggatgccctg tggaaagttt aaaaatattt 11340 
tggaaatgat ttgcatggaa gccatgtgta aaaccatgac atccacttgg aggatgcaat 11400 
aatgaagaaa actacaaatt tacatgcaac tagttatgca tgtagtctat ataatgagga 11460 
ttttgcaata ctttcattca tacacactca ctaagtttta cacgattata atttcttcat 11520 
agccagcgga tccgatatcg ggcccgctag cgttaaccct gctttaatga gatatgcgag 11580 
acgcctatga tcgcatgata tttgctttca attctgttgt gcacgttgta aaaaacctga 11640 
gcatgtgtag ctcagatcct taccgccggt ttcggttcat tctaatgaat atatcacccg 11700 
ttactatcgt atttttatga ataatattct ccgttcaatt tactgattgt ccgtcgacga 11760 
attcgagctc ggcgcgcctc tagaggatcg atgaattcag atcggctgag tggctccttc 11820 
aacgttgcgg ttctgtcagt tccaaacgta aaacggcttg tcccgcgtca tcggcggggg 11880 
tcataacgtg actcccttaa ttctccgctc atgatcagat tgtcgtttcc cgccttcagt 11940 
ttaaactatc agtgtttgac aggatatatt ggcgggtaaa cctaagagaa aagagcgttt 12000 
attagaataa tcggatattt aaaagggcgt gaaaaggttt atccttcgtc catttgtatg 12060 
tgcatgccaa ccacagggtt cccca 12085 

<210> 22 
<211> 12079 
<212> DNA 
<213> Unknown 

<220> 

<223> pflanzlicher Expressionsvektor mit einer 
Promotor-Terminator-ExpressionsJcassette 

<400> 22 

gatctggcgc cggccagcga gacgagcaag attggccgcc gcccgaaacg atccgacagc 60 
gcgcccagca caggtgcgca ggcaaattgc accaacgcat .acagcgccag cagaatgcca 120 
tagtgggcgg tgacgtcgtt cgagtgaacc agatcgcgca ggaggcccgg cagcaccggc 180 
ataatcaggc cgatgccgac agcgtcgagc gcgacagtgc tcagaattac gatcaggggt 240 
atgttgggtt tcacgtctgg cctccggacc agcctccgct ggtccgattg aacgcgcgga 300 
ttctttatca ctgataagtt ggtggacata ttatgtttat cagtgataaa gtgtcaagca 360 
tgacaaagtt gcagccgaat acagtgatcc gtgccgccct ggacctgttg aacgaggtcg 420 
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gcgtagacgg 


tctgacgaca 


cgcaaactgg 


cggaacggtt 


gggggttcag cagccggcgc 


480 


tttactggca 


cttcaggaac 


aagcgggcgc 


tgctcgacgc 


actggccgaa gccatgctgg 


540 


cggagaatca 


tacgcattcg 


gtgccgagag 


ccgacgacga 


ctggcgctca tttctgatcg 


600 


ggaatgcccg 


cagcttcagg 


caggcgctgc 


tcgcctaccg 


cgatggcgcg cgcatccatg 


660 


ccggcacgcg 


accgggcgca 


ccgcagatgg 


aaacggccga 


cgcgcagctt cgcttcctct 


720 


gcgaggcggg 


tttttcggcc 


ggggacgccg 


tcaatgcgct 


gatgacaatc agctacttca 


780 


ctgttggggc 


cgtgcttgag 


gagcaggccg 


gcgacagcga 


tgccggcgag cgcggcggca 


840 


ccgttgaaca 


ggctccgctc 


tc^ccgctgt 


tgcgggccgc 


gatagacgcc 


ttcgacgaag 


900 


ccggtccgga 


cgcagcgttc 


gagcagggac 


tcgcggtgat 


tgtcgatgga 


ttggcgaaaa 


960 


ggaggctcgt 


tgtcaggaac 


gttgaaggac 


cgagaaaggg 


tgacgattga* 


tcaggacegc 


1020 


tgccggagcg 


caacccactc 


actacagcag 


agccatgtag 


acaacatccc 


ctcccccttt 


1080 


ccaccgcgtc 


agacgcccgt 


agcagcccgc 


tacgggcttt 


ttcatgccct 


gccctagcgt 


1140 


ccaagcctca 


cggccgcgct 


cggcctctct 


ggcggccttc 


tggcgctctt 


ccgcttcctc 


1200 


gctcactgac 


tcgctgcgct 


cggtcgttcg 


gctgcggcga 


gcggtatcag 


ctcactcaaa 


1260 


ggcggtaata 


cggttatcca 


cagaatcagg 


ggataacgca 


ggaaagaaca 


tgtgagcaaa 


1320 


aggccagcaa 


aaggccagga 


accgtaaaaa 


ggccgcgttg 


ctggcgtttt 


tccataggct 


1380 


ccgcccccct: 


gacgagcatc 


acaaaaatcg 


acgctcaagt 


c^gaggtggc 


gaaacccgac 


1440 


aggactataa 


agataccagg 


cgtttccccc 


tggaagctcc 


ctcgtgcgct 


ctcctgttcc 


1500 


gaccctgccg 


cttaccggat 


acctgtccgc 


ctttctccct 


tcgggaagcg 


tggcgctttt 


15*60 


ccgctgcata 


accctgcttc 


ggggtcatta 


tagcgatttt 


ttcggtatat 


ccatcctttt 


1620 


tcgcacgata 


tacaggattt 


tgccaaaggg 


ttcgtgtaga 


ctttccttgg 


tgtatccaac 


1680 


ggcgtcagcc 


gggcaggata 


ggtgaagtag 


gcccacccgc 


gagcgggtgt 


tccttcttca 


1740 


ctgtccctta 


ttcgcacctg 


gcggtgctca 


acgggaatcc 


tgctctgcga 


ggctggccgg 


1800 


ctaccgccgg 


cgtaacagat 


gagggcaagc 


ggatggctga 


tgaaaccaag 


ccaaccagga 


1860 


acrcrcreacre cc 


acctiatcaacr 


crtcrtiactcrcc 


1 1 c c acraccra 


acgaagagcg 


attgaggaaa 


1920 


aggcggcggc 


ggccggcatg 


agcctgtcgg 


cctacctgct 


ggccgtcggc 


cagggctaca 


1980 


aaatcacggg 


cgtcgtggac 


tatgagcacg 


tccgcgagct 


ggcccgcatc 


aatggcgacc 


2040 


tgggccgcct 


gggcggcctg 


ctgaaactct 


ggctcaccga 


cgacccgcgc 


acggcgcggt 


2100 


tcggtgatgc 


cacgatcctc 


gccctgctgg 


cgaagatcga 


agagaagcag 


gacgagcttg 


2160 
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gcaaggtcat 


gatgggcgtg 


gtccgcccga 


gggcagagcc 


atgacttttt 


tagccgctaa 


2220 


aacggccggg 


gggtgcgcgt 


gattgccaag 


cacgtcccca 


tgcgctccat 


caagaagagc 


2280 


gacttcgcgg 


agctggtgaa 


gtacatcacc 


gacgagcaag 


gcaagaccga 


gcgcctttgc 


2340 


gacgctcacc 


gggctggttg 


ccctcgccgc 


tgggctggcg 


gccgtctatg 


gccctgcaaa 


2400 


cgcgccagaa 


acgccgtcga 


agccgtgtgc 


gagacaccgc 


ggccgccggc 


gttgtggata 


2460 


cctcgcggaa 


aacttggccc 


tcactgacag 


atgaggggcg 


gacgttgaca 


cttgaggggc 


2520 


cgactcaccc 


ggcgcggcgt 


tgacagatga 


ggggcaggct 


cgatttcggc 


cggcgacgtg 


2580 


gagctggcca 


gcctcgcaaa 


tcggcgaaaa 


cgcctgattt 


tacgcgagtt 


tcccacagat 


2640 


gatgtggaca 


agcctgggga 


taagtgccct 


gcggtattga 


cacttgaggg 


gcgcgactac 


2700 


tgacagatga 


ggggcgcgat 


ccttgacact 


tgaggggcag 


agtgctgaca 


gatgaggggc 


2760 


gcacctattg 


acatttgagg 


ggctgtccac 


aggcagaaaa 


tccagcattt 


gcaagggttt 


2820 


ccgcccgttt 


ttcggccacc 


gctaacctgt 


cttttaaccf 


gcttttaaac 


caatatttat 


2880 


aaaccttgtt 


tttaaccagg 


gctgcgccct 


gtgcgcgtga 


ccgcgcacgc 


cgaagggggg 


2940 


tgccccccct 


tctcgsiaccc 


tcccggcccg 


ctaacgcggg 


cctcccatcc 


ccccaggggc 


3000 


tgcgcccctc 


ggccgcgaac 


ggcctcaccc 


caaaaatggc 


agcgctggca 


gtccttgcca 


3060 


ttgccgggat 


cggggcagta 


acgggatggg 


cgatcagccc 


gagcgcgacg 


cccggaagca 


3120 


ttgacgtgcc 


gcaggtgctg 


gcatcgacat 


tcagcgacca 


ggtgccgggc 


agtgagggcg 


3180 


gcggcctggg 


tggcggcctg 


cccttcactt 


cggccgtcgg 


ggcattcacg 


gacttcatgg 


3240 


cggggccggc 


aatttttacc 


ttgggcattc 


ttggcatagt 


ggtcgcgggt 


gccgtgctcg 


3300 


tgttcggggg 


tgcgataaac 


ccagcgaacc 


atttgaggtg 


ataggtaaga 


ttataccgag 


3360, 


gtatgaaaac 


gagaattgga 


cctttacaga 


attactctat 


gaagcgccat 


atttaaaaag 


3420 


ctaccaagac 


gaagaggatg 


aagaggatga 


ggaggcagat 


tgccttgaat 


atattgacaa 


3480 


tactgataag 


ataatatatc 


ttttatatag 


aagatatcgc 


cgtatgtaag 


gatttcaggg 


3540 


ggcaaggcat 


aggcagcgcg 


cttatcaata 


tatctataga 


atgggcaaag 


cataaaaact 


3600 


tgcatggact 


aatgcttgaa 


acccaggaca 


ataaccttat 


agcttgtaaa 


ttctatcata 


3660 


attgggtaat 


gactccaact 


tattgatagt 


gttttatgtt 


cagataatgc 


ccgatgactt 


3720 


tgtcatgcag 


ctccaccgat 


tttgagaacg 


acagcgactt 


ccgtcccagc 


cgtgccaggt 


3780 


gctgcctcag 


attcaggtta 


tgccgctcaa 


ttcgctgcgt 


atatcgcttg 


ctgattacgt 


3840 


gcagctttcc 


cttcaggcgg 


gattcataca 


gcggccagcc 


atccgtcatc 


catatcacca 


3900 
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cgtcaaaggg tgacagcagg ctcataagac 
atacgtgcgc aacaaccgtc ttccggagac 
gcgatttagc cccgacatag ccccactgtt 
tgcccggctg tatgcgcgag gttaccgact 
cgtgttgagg ccaacgccca taatgcgggc 
catatcaatg attttctggt gcgtaccggg 
ccatgtttta cggcagtgag agcagagata 
acgcaccacc ccgtcagtag ctgaacagga 
agcacctcaa aaacaccatc atacactaaa 
tggtttcaaa atcggctccg tcgatactat 
aaaagctgtt ttctggtatt taaggtttta 
cttgttataa ttagcttctt ggggtatctt 
taaatggcta aaatgagaat atcaccggaa 
gtaaaagata cggaaggaat gtctcctgct 
aacctatatt taaaaatgac ggacagccgg 
gaaaaggaca tgatgctatg gctggaagga 
gaacggcatg atggctggag caatctgctc 
gaagagtatg aagatgaaca aagccctgaa 
aggctctttc actccatcga catatcggat 
ttagccgaat tggattactt actgaataac 
gaagaagaca ctccatttaa agatccgcgc 
cccgaagagg aacttgtctt ttcccacggc 
gatggcaaag taagtggctt tattgatctt 
gacattgcct tctgcgtccg gtcgatcagg 
ctattttttg acttactggg gatcaagcct 
ctggatgaat tgttttagta cctagatgtg 
caccgacttc ttccgcatca agtgttttgg 
gggcaagggg tcgctggtat tcgtgcaggg 
cggccagacg gtctacggga ccgacttcat 



gccccagcgt 


cgccatagtg cgttcaccga 


3960 


tgtcatacgc 


gtaaaacagc 


cagcgctggc 


4020 


cgtccatttc 


cgcgcagacg atgacgtcac 


4080 


gcggcctgag 


ttttttaagt gacgtaaaat 


4140 


tgttgcccgg 


catccaacgc 


cattcatggc 


4200 


ttgagaagcg 


gtgtaagtga actgcagttg 


4260 


gcgctgatgt 


ccggcggtgc 


ttttgccgtt 


4320 


gggacagctg 


atagacacag 


aagccactgg 


4380 


tcagtaagtt 


ggcagcatca 


cccataattg 


4440. 


Gfttatacgcc 


aactttgaaa 


acaactttga 


4500 


gaatgcaagg 


aacagtgaat 


tggagttcgt 


4560 


taaatactgt 


agaaaagagg 


aaggaaataa 


4620 


ttgaaaaaac 


tgatcgaaaa 


ataccgctgc 


4680 


aaggtatata 


agctggtgg'g 


agaaaatgaa 


4740 


tataaaggga 


ccacctatga 


tgtggaacgg 


4800 


aagctgcctg 


ttccaaaggt 


cctgcacttt 


4860 


atgagtgagg 


ccgatggcgt 


cctttgctcg 


4920 


aagattatcg 


agctgtatgc 


ggagtgcatc 


4980 


tgtccctata 


cgaatagctt 


agacagccgc 


5040 


gatctggccg 


atgtggattg 


cgaaaactgg 


5100 


gagctgtatg 


attttttaaa 


gacggaaaag 


5160 


gacctgggag 


acagcaacat 


ctttgtgaaa 


5220 


gggagaagcg 


gcagggcgga 


caagtggtat 


•5280 


gaggatatcg 


gggaagaaca 


gtatgtcgag 


5340 


gattgggaga 


aaataaaata 


ttatatttta 


5400 


gcgcaacgat 


gccggcgaca 


agcaggagcg 


5460 


ctctcaggcc 


gaggcccacg 


gcaagtattt 


5520 


caagattcgg 


aataccaagt 


acgagaagga 


5580 


tgccgataag 


gtggattatc 


tggacaccaa 


5640 
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ggcaccaggc gggtcaaatc aggaataagg 
cccgcaagga gggtgaatga atcggacgtt 
cgacgcgggg ttttccgccg aggatgccga 
gccccgcgaa accttccagt ccgtcggctc 
gcgcgacagc gtgcaactgg ctccccptgc 
ttcgcgtcgt ctcgaacagg aggcggcagg 
aggaactatg acgaccaaga agcgaaaaac 
cgaggccaag caggccgcgt tgctgaaaca 
ttccttgttc gatattgcgc cgtggccgga 
ccgctctgcc ctgttcacca cgcgcaacaa 
ggtcattttc cacgtcaaca aggacgtgaa 
cgacgatgac gaactggtgt ggcagcaggt 
cgagccgatc accttcacgt tctacgagct 
ccggtattac acgaaggccg aggaatgcct 
cacgtccgac cgcgttgggc acctggaatc 
ggaccgtggc aagaaaacgt cccgttgcca 
gtttgctggc gaccactaca cgaaattcat 
ggcccgacgg atgttcgact atttcagctc 
aaccttccgc ctcatgtgcg gatcggattc 
cggcgaagcc tgcgaagagt tgcgaggcag 
tgacctggtg cattgcaaac gctagggcct 
agccagcgct ttactggcat ttcaggaaca 
tcagtatcgc tcgggacgca cggcgcgctc 
ttgacaattg tgattaaggc tcagattcga 
cgcgagatcc gattgtcggc cctgaagaaa 
cacgaggaga aaaagcccat ggaggcgttc 
ggcgcctaca tcgacggcga gatcattggg 
aaggacgctc acaaggcgca tctgtccggc 
ggggtcgccg gtatgctgct gcgggcgttg 



gcacattgcc ccggcgtgag tcggggcaat 5700 
tg&ccggaag.gcatacaggc aagaactgat 5760 
aaccatcgca agccgcaccg tcatgcgtgc 5820 
gatggtccag caagctacgg ccaagatcga 5880 
cctgcccgcg ccatcggccg ccgtggagcg 5940 
tttggcgaag tcgatgacca tcgacacgcg 6000 
cgccggcgag gacctggcaa . aacaggtcag 6060 
cacgaagcag cagatcaagg aaatgcagct 6120 
cacgatgcga gcgatgccaa acgacacggc 6180 
gaaaatcccg cgcgaggcgc tgcaaaaceia 6240 
gatcacctac accggcgtcg agctgcgggc 6300 
gttggagtac gcgaagcgca cccctatcgg 6360 
ttgccaggac ctgggctggt cgatcaatgg 6420 
gtcgcgccta caggcgacgg cgatgggctt 6480 
ggtgtcgctg ctgcaccgct tccgcgtcct 6540 
ggtcctgatc gacgaggaaa tcgtcgtgct 6600 
atgggagaag taccgcaagc tgtcgccgac 6660 
gcaccgggag ccgtacccgc tcaagctgga 6720 
cacccgcgtg aagaagtggc gcgagcaggt 6780 
cggcctggtg gaacacgcct gggtcaatga 6840 
tgtggggtca gttccggctg ggggttcagc 6900 
agcgggcact gctcgacgca cttgcttcgc 6960 
tacgaactgc cgataaacag- aggattaaaa 7020 
cggcttggag gggccgacgt gcaggatttc 7080 
gctccagaga tgttcgggtc cgtttacgag 7140 
gctgaacggt tgcgagatgc cgtggcattc 7200 
ctgtcggtct tcaaacagga ggacggcccc 7260 
gttttcgtgg agcccgaaca gcgaggccga 7320 
ccggcgggtt tattgctcgt gatgatcgtc 7380 
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cgacagattc caacgggaat ctggtggatg cgcatcttca tcctcggcgc acttaatatt 7440 
tcgctattct ggagcttgtt gtttatttcg gtctaccgcc tgccgggcgg ggtcgcggcg 7500 
acggtaggcg ctgtgcagcc gctgatggtc gtgttcatct ctgccgctct gctaggtagc 7560 
ccgatacgat tgatggcggt cctgggggct atttgcggaa ctgcgggcgt ggcgctgttg 7620 
gtgttgacac caaacgcagc gct'agatcct gtcggcgtcg cagcgggcct ggcgggggcg 7680 
gtttccatgg cgttcggaac cgtgctgacc cgcaagtggc aacctcccgt gcctctgctc 7740 
acctttaccg cctggcaact ggcggccgga ggacttctgc tcgttccagt agctttagtg 7800 
tttgatccgc caatcccgat gcctacagga accaatgttc tcggcctggc gtggctcggc 7860 
ctgatcggag cgggtttaac ctacttcctt tggttccggg ggatctcgcg actcgaacct 7920 
acagttgttt-ccttactggg ctttctcagc cccagatctg gggtcgatca gccggggatg 7980 
catcaggccg acagtcggaa cttcgggtcc ccgacctgta ccattcggtg agcaatggat 8.040 
aggggagttg atatcgtcaa cgttcacttc taaagaaata gcgccactca gcttcctcag 8100 
cggctttatc cagcgatttc ctattatgtc ggcatagttc'tcaagatcga cagcctgtca 8160 
cggttaagcg agaaatgaat aagaaggctg ataattcgga tctctgcgag ggagatgata 8220 
tttgatcaca ggcagcaacg ctctgtcatc gttacaatca acatgctacc ctccgcgaga 8280 
• tcatccgtgt ttcaaacccg gcagcttagt tgccgttctt ccgaatagca tcggtaacat 8340 
gagcaaagtc tgccgcctta caacggctct cccgctgacg ccgtcccgga ctgatgggct 8400 
gcctgtatcg agtggtgatt ttgtgccgag ctgccggtcg gggagctgtt ggctggctgg 8460 
tggcaggata tattgtggtg taaacaaatt gacgcttaga caacttaata acacattgcg 8520 
gacgttttta atgtactggg gtggtttttc ttttcaccag tgagacgggc aacagctgat 8580 
tgcccttcaq cgcctggccc tgagagagtt gcagcaagcg gtccacgctg gtttgcccca 8640 
gcaggcgaaa atcctgtttg atggtggttc cgaaatcggc aaaatccctt ataaatc^aa 8700 
agaatagccc gagatagggt tgagtgttgt tccagtttgg aacaagagtc cactattaaa 8760 
gaacgtggac .tccaacgtca aagggcgaaa aaccgtctat cagggcgatg gcccactacg 8820 
tgaaccatca cccaaatcaa gttttttggg gtcgaggtgc cgtaaagcac taaatcggaa 8880 
ccctaaaggg agcccccgat ttagagcttg acggggaaag ccggcgaacg tggcgagaaa 8940 
ggaagggaag aaagcgaaag gagcgggcgc cattcaggct gcgcaactgt tgggaagggc 9000 
gatcggtgcg ggcctcttcg ctattacgcc agctggcgaa agggggatgt gctgcaaggc 9060 
gattaagttg ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg acggccagtg 9120 
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aattaattcc 


catcttgaaa 


gaaatatagt 


ggtattatag 


tccaagcaaa 


aacataaatt 


tcaataactg 


attatatcag 


ctggtacatt 


tgtgtaatac 


ataaattgat 


gatatagcta 


agcttgggtc 


ccgctcagaa 


gaactcgtca 


tcgggagcgg 


cgataccgta 


aagcacgagg 


tcagcaatat 


cacgggtagc 


caacgctatg 


ccacagtcga 


tgaatccaga 


aaagcggcca 


tcgccatggg 


tcacgacgag 


atcctcgccg 


agttcggctg 


gcgcgagccc 


ctgatgctct 


gcttccatcc 


gagtacgtgc 


tcgctcgatg 


gtagccggat 


caagcgtatg 


cagccgccgc 


gcaggagcaa 


ggtgagatga 


caggagatcc 


tcccttcccg 


cttcagtgac 


aacgtcgagc 


agccacgata 


gccgcgctgc 


ctcgtcctgc 


ttgacaaaaa 


gaaccgggcg 


cccctgcgct 


ccgattgtct 


gttgtgccca 


gtcatagccg 


cctgcgtgca 


atccatcttg 


ttcaatccaa 


tctggattga 


gagtgaatat 


gagactctaa 


agtggagcat 


ttttgacaag 


aaatatttgc 


acgcgcaata 


atggtttctg 


acgtatgtgc 


tgagtggctc 


cttcaacgtt 


gcggttctgt 


gtcatcggcg 


ggggtcataa 


cgtgactccc 


gcgccatcag 


atccttggcg 


gcaagaaagc 


cttaccagag 


ggcgccccag 


ctggcaattc 


gtctagctat 


cgccatgrtaa 


gcccactgca 


ttcccttgtc 


cagatagccc 


agtagctgac 


actggctttc 


tacgtgttcc 


gcttccttta 


gcgtgaagct 


tgcatgcctg 


caggtcgacg 



ttaaatattt attgataaaa taacaagtca 9180 
tattgatgca agtttaaatt cagaaatatt 9240 
gccgtagatg aaagactgag tgcgatatta 9300 
gcttagctca tcgggggatc cgtcgaagct 9360 
agaaggcgat agaaggqgat gcgctgcgaa 9420 
aagcggtcag cccattcgcc gccaagctct 9480 
tcctgatagc gcftccgccac acccagccgg 9540 
ttttccacca tgatattcgg caagcaggca 9600 
tcgggcatgc gcgccttgag cctggcgaac 9660 
tcgtccagat catcctgatc gacaagaccg 9720 
cgatgtttcg cttggtggtc gaatgggcag 9780 
attgcatcag ccatgatgga tactttctcg 9840 
tgccccggca cttcgcccaa tagcagccag 9900 
acagctgcgc aaggaacgcc /:gtcgtggcc 9960 
agttcattca gggcaccgga caggtcggtc 10020 
gacagccgga acacggcggc atcagagcag 10080 
ciatagcctct ccacccaagc ggccggagaa 10140 
gctcccatgg gccctcgact agagtcgaga 10200 
ttggataccg aggggaattt atggaacgtc 10260 
tagctgatag tgaccttagg cgacttttga 10320 
ttagctcatt aaactccaga aacccgcggc 10380 
cagttccaaa cgtaaeiacgg cttgtcccgc 10440 
ttaattctcc gctcatgatc ttgatcccct 10500 
catccagttt actttgcagg gcttcccaac 10560 
cggttcgctt gctgtccata aaaccgccca 10620 
agctacctgc tttctctttg cgcttgcgtt 10680 
attcatccgg ggtcagcacc gtttctgcgg 10740 
gcagcccttg cgccctgagt gcttgcggca 10800 
gcgcgccgag ctcctcgagc aaatttacac 10860 
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attgccacta 


aacgtctaaa cccttgtaat ttgtttttgt tttactatgt gtgttatgta 


10920 


tttgatttgc 


gataaatttt tatatttggt actaaattta taacaccttt tatgctaacg 


10980 


tttgccaaca 


cttagcaatt 


tgcaagttga ttaattgatt ctaaattatt tttgtcttct 


11040 


aaatacatat 


actaatcaac 


tggaaatgta aatatttgct aatatttcta ctataggaga 


11100 


attaaagtga 


gtgaatatgg 


taccacaagg tttggagatt taattgttgc aatgctgcat 


11160 


ggatggcata 


tacaccaaac 


attcaataat tcttgaggat aataatggta • ccacacaaga 


11220 


tttgaggtgc 


atgaacgtca 


cgtggacaaa aggtttagta atttttcaag acaacaatgt 


11280 


taccacacac 


aagttttgag 


gtgcatgcat ggatgccctg tggaaagttt aaaaatattt 


11340 


tggaaatgat 


ttgcatggaa 


gccatgtgta aaaccatgac atccacttgg aggatgcaat 


11400 


aatgaagaaa 


actacaaatt 


tacatgcaac tagttatgca tgtagtctat ataatgagga 


11460 


ttttgcaata 


ctttcattca 


tacacactca ctaagtttta cacgattata atttcttcat 


11520 


agccagcaga 


tctgccggca 


tcgatcccgg gccatggcct gctttaatga gatatgcgag 


11580 


acgcctatga 


tcgcatgata 


tttgctttca attctgttgt "gcacgttgta aaaaacctga 


11640 


gcatgtgtag 


ctcagatcct 


taccgccggt ttcggttcat tctaatgaat atatcacccg 


11700 


ttactatcgt 


atttttatga 


ataatattct ccgttcaatt tactgattgt ccgtcgacga 


1176a 


gctcggqgcg 


cctctagagg 


atcgatgaat tcagatcggc tgagtggctc cttcaacgtt 


11820 


gcggttctgt 


cagttccaaa 


cgtaaaacgg cttgtcccgc gtcatcggcg ggggtcataa 


11880 


cgtgactccc 


ttaattctcc 


gctcatgatc agattgtcgt ttcccgcctt cagtttaaac 


11940 


tatcagtgtt 


tgacaggata 


tattggcggg taaacctaag agaaaagagc gtttattaga 


12000 


ataatcggat 


atttaaaagg 


gcgtgaaaag gtttatcctt cgtccatttg tatgtgcatg 


12060 


ccaaccacag 


ggttcccca 




12079 



<210> 23 
<211> 13002 
<212> DNA 
<213> Unknown 

<220> 

<223> pflanzlicher Expressionsvektor mit zwei 
Proraotor-Tezioinator-Esqpressionskassetten 

<400> 23 

gatctggcgc cggccagcga gacgagcaag attggccgcc gcccgaaacg atccgacagc 60 
gcgcccagca caggtgcgca ggcaaattgc accaacgcat acagcgccag cagaatgcca 120 



tagtgggcgg tgacgtcgtt cgagtgaacc 
ataatcaggc cgatgccgac agcgtcgagc 
atgttgggtt tcacgtctgg cctccggacc 
ttctttatca ctgataagtt ggtggacata 
tgacaaagtt gcagccgaat acagtgatcc 
gcgtagacgg tctgacgaca cgcaaactgg 
tttactggca cttcaggaac aagcgggcgc 
cggagaatca tacgcattcg gtgccgagag 
ggaatgcccg cagcttcagg caggegctgc 
ccggcacgcg accgggcgca ccgcagatgg 
gcgaggcggg tttttcggcc gggrgacgccg. 
ctgttggggc cgtgcttgag gagcaggccg 
ccgttgaaca ggctccgctc tcgccgctgt 
ccggtccgga cgcagcgttc gagcagggac 
ggaggctcgt tgtcaggaac gttgaaggac 
tgccgga&cg caacccactc actacagcag 
ccaccgcgtc agacgcccgt agcagcccgc 
ccaagcctca cggccgcgct cggcctctct 
gctcactgac tcgctgcgct cggtcgttcg 
ggcggtaata cggttatcca cagaatcagg 
aggccagcaa aaggccagga accgtaaaaa 
ccgcccccct gacgagcatc acaaaaatcg 
aggactataa agataccagg cgtttccccc 
gaccctgccg cttaccggat acctgtccgc 
ccgctgcata accctgcttc ggggtcatta 
tcgcacgata tacaggattt tgccaaaggg 
ggcgtcagcc gggcaggata ggtgaagtag 
ctgtccctta ttcgcacctg gcggtgctca 
ctaccgccgg cgtaacagat gagggcaagc 
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agatcgcgca ggaggcccgg cagcaccggc 180 
gcgacagtgc tcagaattac gatcaggggt 240 
agcctccgct ggtccgattg aacgcgcgga 300 
ttatgtttat cagtgateiaa gtgtcaagca 360 
gtgccgccct ggacctgttg aacgagglicg 420 
cggaacggtt gggggttcag cagccggcgc 480 
tgctcgacgc actggccgaa gccatgctgg 540 
ccgacgacga ctggcgctca tttctgatcg 600 
tcgcctaccg cgatggcgcg cgcatccatg 660 
aaacggccga cgcgcagctt cgcttcctct 720 
tcaatgcgct gatgacaatc agctacttca 780 
gcgacagcga tgccggcgag cgcggcggca 840 
tgcgggccgc gatagacgcc ttcgacgaag 900 
tcgcggtgat tgtcgatgga ttggcgaaaa 960 
cgagaaaggg tgacgattga tcaggaccgc 1020 
agccatgtagacaacatccc ctcccccttt 1080 
tacgggcttt ttcatgccct gccctagcgt 1140 
ggcggccttc tggcgctctt ccgcttcctc 1200 
gctgcggcga gcggtatcag ctcactcaaa 1260 
ggataacgca ggaaagaaca tgtgagcaaa 1320 
ggccgcgttg ctggcgtttt tccataggct 1380 
acgctcaagt cagaggtggc gaaacccgac 1440 
tggaagctcc ctcgtgcgct ctcctgttcc 1500 
ctttctccct tcgggaagcg tggcgctttt 1560* 
tagcgatttt ttcggtatat ccatcctttt 1620 
ttcgtgtaga ctttccttgg tgtatccaac 1680 
gcccacccgc gagcgggtgt tccttcttca 1740 
acgggaatcc tgctctgcga ggctggccgg 1800 
ggatggctga tgaaaccaag ccaaccagga 1860 



£LcrQcrca.crc cc 


acctatcaag 


gtgtactgcc 


acrcrc croc GCTC 


aaccacrcatcr 


agcctgtcgg 


aaatcacgcfg 


cgtcgtggac 


tatgagcacg 


tgggccgcct 


gggcggcctg 


ctgaaactct 


tcggtgatgc 


cacgatcctc 


gccctgctgg 


gcaaggtcat 


gatgggcgtg 

9 9 9 9 S ^ 9 


gtccgcccga 


aacggccggg 


gggtgcgcgt 

0 0 9 w 3 9 


gattgccaag 


gacttcgcgg 


agctggtgaa 


gtacatcacc 


gacgcticacc 


acrgctagttg 

9 9 9^ ** 9 9 ••9 


ccctcgccgc 


caccrc cacaa 


acgccgtcga 


agccgtgtgo 


ccticgcggaa 


aacttggccc 


tcactgacag 


cgac tcaccc 


acrcacggccit 

9 9^9 ^9 9 9 ** 


tgacagatga 


gagctggcca 


gcctcgcaaa 


tcggcgaaaa 


aatgtagaca 


agcctgggga 


taagtgccct 


tgacagatga 


ggggcgcgat 


ccttgacact 


gcacctattg 


acatttgagg 


ggctgtccac 


ccgcccgttt 


ttcggccacc 


.gctaacctgt 


aaaccttctt 


tt^aaccagg 


gctgcgccct 


tcrccccccct 


tctcgaaccc 


tcccggcccg 




crcrcecrecraac 


crcrcetcacee 


1 1 crc ncrcrcra t 


ccfO'crcrcacrtia 


accFcro'atcrQQ 

9 39 9 S9 9 


t tcaccrtiQCC 


gcaggtgctg 


gcatcgacat 


cTCCTcrc c tiQcrcr 


tggcggcctg 


cccttcactt 


CGrcrcrcrciCGrGrc 


aatttttacc 


ttgggcattc 


tier 1 1 ccrcrcrcrcf 


tgcgataaac. ccagcgaacc 


gtatgaaaac 


gagaattgga cctttacaga 


ctaccaagac 


gaagaggatg 


aagaggatga 


tactgataag 


ataatatatc 


ttttatatag 


ggcaaggcat 


aggcagcgcg 


cttatcaata 
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ttccagacga 


acgaagagcg 


attgaggaaa 


1920 


cctacctgct 


ggccgtcggc 


cagggctaca 


1980 


tccgcgagct 


ggcccgcatc 


aatggcgacc 


2040 


ggctcaccga 


cgacccgcgc 


acggcgcggt 


2100 


cgaagatcga 


agagaagcag 


gacgagcttg 


2160 


gggcagagcc 


atgacttttt 


tagccgctaa 


2220 


cacgtcccca 


tgcgctccat 


caagaagagc 


2280 


gacgagcaag 


gcaagaccga 


gcgcctttgc 


2340 


tgggctggcg 


gccgtctatg 


gccctgcaaa 


2400 


gagacaccgc 


ggccgccggc 


gttgtggata 


2460 


atgaggggcg 


gacgttgaca 


cttgaggggc 


2520 


ggggcaggct 


cgatttcggc 


cggcgacgtg 


2580 


cgcctgattt 


tacgcgagtt 


tcccacagat 


2640 


gcggtattga 


cacttgaggg 


gcgcgactac 


2700 


tgaggggcag 


agtgctgaca 


gatgaggggc 


2760 


aggcagaaaa 


tccagcattt 


gcaagggttt 


2820 


cttttaacct 


gcttttaaac 


caatatttat 


2880 


gtgcgcgtga 


ccgcgcacgc 


cgaagggggg 


2940 


ctaacgcggg 


cctcccatcc 


ccccaggggc 


3000 


caaaaatggc 


agcgctggca 


gtccttgcca 


3060 


cgatcagccc 


gagcgcgacg 


cccggaagca 


3120 


tcagcgacca 


ggtgccgggc 


agtgagggcg 


3180 


cggccgtcgg 


ggcattcacg 


gacttcatgg 


3240 


ttggcatagt 


ggtcgcgggt 


gccgtgctcg 


3300 


atttgaggtg 


ataggtaaga 


ttataccgag 


3360 


attactctat 


gaagcgccat 


atttaaaaag 


3420 


ggaggcagat 


tgccttgaat 


atattgacaa 


3480 


aagatatcgc 


cgtatgtaag 


gatttcaggg 


3540 


tatctataga 


atgggcaaag 


cataaaaact 


3600 
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tgcatggact 


aatgcttgaa 


-acccaggaca 


ataaccttat 


agcttgtaaa 


ttctatcata 


3660 


attgggtaat 


gactccaact 


tattgatagt 


gttttatgtt 


cagataatgc 


ccgatgactt 


3720 


tgtcatgcag 


ctccaccgat 


tttgagaacg 


acagcgactt 


ccgtcccagc 


cgtgccaggt 


3780 


gctgcctcag 


attcaggtta 


tgccgctcaa 


ttcgctgcgt 


atatcgcttg 


ctgattacgt 


3840 


gcagctttcc 


cttcaggcgg 


gattcataca 


gcggccagcc 


atccgtcatc 


catatcacca 


3900 


cgtcaaaggg 


tgacagcagg 


ctcataagac 


gccccagcgt 


cgccatagtg 


cgttcaccga 


3960 


atacgtgcgc 


aacaaccgtc 


ttccggagac 


tgtcatacgc 


gtaaaacagc 


cagcgctggc 


4020 


gcgatttagc 


cccgacatag 


ccccactgtt 


cgtccatttc 


cgcgcagacg 


atgacgtcac 


4080 


tgcccggctg 


tatgcgcgag 


gttaccgact 


gcggcctgag 


ttttttaagt 


gacgtaaaat 


4140 


cgtgttgagg 


ccaacgccca 


taatgcgggc 


tgttgcccgg 


catccaacgc 


cattcatggc 


4200 


catatcaatg 


attttctggt 


gcgtaccggg 


ttgagaagcg 


.gtgtaagtga 


actgcagttg 


4260 


ccatgtttta 


cororcagtgag 


agcagagata 


gcgctgatgt 


ccggcggtgc 


ttttgccgtt 


4320 


acgcaccacc 


ccgtcagtag 


ctg2Lacagga 


gggacagctg 


atagacacag 


aagccactgg 


4380 


agcacctcaa 


aaacaccatc 


atacactaaa 


tcagtaagtt 


ggcagcatca 


cccataattg 


4440 


tggtttcaaa 


atcggctccg 


tcgatactat 


gttatacgcc 


aactttgaaa 


acaactttga 


4500 


aaaagctgtt 


ttctggtatt 


taaggtttta 


gaatgcaagg 


aacagtgaat 


tggagttcgt 


4560 


cttgttataa 


ttagcttctt 


ggggtatctt 


taaatactgt 


agaaaagagg 


aaggaaataa 


4620 


taaatggcta 


aaatgagaat 


atcaccggaa 


ttgaaaaaac 


tgatcgaaaa 


ataccgctgc 


4680 


gtaaaagata 


cggaaggaat 


gtctcctgct 


aaggtatata 


agctggtggg 


agaaaatgaa 


4740 


aacctatatt 


taaaaatgac 


ggacagccgg 


tataaaggga 


ccacctatga 


tgtggaacgg 


4800 


gaaaaggaca 


tgatgctatg 


gctggaagga 


aagctgcctg 


ttccaaaggt 


cctgcacttt 


4860 


gaacggcatg 


atggctggag 


caatctgctc 


atgagtgagg 


ccgatggcgt 


cctttgctcg 


4920 


craaaaotatcr 


aagatgaaca 


aagccctgaa 


aagattatcg 


agctgtatgc 


ggagtgcatc 


4980 


aggctctttic 


actccatcga 


catatcggat 


tgtccctata 


cgaatagctt 


agacagccgc 


5040 


1 1 age cgaat 


tggattactt 


actgaataac 


gate tggccg 


atgtggattg 


cgaaaactgg 


5100 


gaagaagaca 


ctccatttaa 


agate cgcgc 


gagctgtatg 


attttttaaa 


gacggaaaag 


5160 


cccgaagagg 


aacttgtctt 


ttcccacggc 


gacctgggag 


acagcaacat 


ctttgtgaaa 


5220 


gatggcaaag 


taagtggctt 


tattgatctt 


gggagaagcg 


gcagggcgga 


caagtggtat 


5280 


gacattgcct 


tctgcgtccg 


gtcgatcagg 


gaggatatcg 


gggaagaaca 


gtatgtcgag 


5340 
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ctattttttg acttactggg gatcaagcct gattgggaga aaataaaata ttatatttta 5400 
ctggatgaat tgttttagta cctagatgtg gcgcaacgat gccggcgaca agcaggagcg 5460 
caccgacttc ttccgcatca agtgttttgg ctctcaggcc gaggcccacg gcaagtattt 5520 
gggcaagggg tcgctggtat tcgtgcaggg caagattcgg aataccaagt acgagaagga 5580 
cggccagacg gtctacggga ccgacttcat tgccgataag gtggattatc tggacaccaa 5640 
ggcaccaggc gggtcaaatc aggaataagg gcacattgcc ccggcgtgag tcggggcaat 5700 
cccgcaagga gggtgaatga atcggacgtt tgaccggaag gcatacaggc aagaactgat 5760 
cgacgcgggg ttttccgccg aggatgccga aaccatcgca agccgcaccg tcatgcgtgc 5820 
gccccgcgaa accttccagt ccgtcggctc gatggtccag caagctacgg ccaagatcga 5880 
gcgcgacagc gtgcaactgg ctccccctgc cctgcccgcg ccatcggccg ccgtggagcg 5940 
ttcgcgtcgt ctcgaacagg aggcggcagg tttggcgaag . tcgatgacca tcgacacgcg 6000 
aggaactatg acgaccaaga agcgaaaaac cgccggcgag gacctggcaa aacaggtcag 6060 
cgaggccaag caggccgcgt tgctgaaaca cacgaagcag cagatcaagg aaatgcagct 6120 
ttccttgttc gatattgcgc cgtggccgga cacgatgcga gcgatgccaa acgacacggc 6180 
ccgctctgcc ctgtt caeca cgcgcaacaa gaaaatcccg cgcgaggcgc tgcaaaacaa 6240 
ggtcattttc cacgtcaaca aggacgtgaa gatcacctac accggcgtcg agctgcgggc 6300 
cgacgatgac gaactggtgt ggcagcaggt gttggagtac gcgaagcgca cccctatcgg 6360 
cgagccgatc accttcacgt tctacgagct ttgccaggac ctgggctggt cgatcaatgg 6420 
ccggtattac acgaaggccg aggaatgcct gtcgcgccta- caggcgacgg cgatgggctt 6480 
cacgtccgac cgc^ttgggc acctggaatc ggtgtcgctg ctgcaccgct tccgcgtcct 6540 
ggaccgtggc aagaaaacgt cccgttgcca ggtcctgatc gacgaggaaa tcgtcgtgct 6600 
gtttgctggc gaccactaca cgaaattcat atgggagaag taccgcaagc tgtcgccgac 6660 
ggcccgacgg atgttcgact atttcagctc gcaccgggag ccgtacccgc tcaagctgga 6720 
aaccttccgc ctcatgtgcg gatcggattc cacccgcgtg aagaagtggc gcgagcaggt 6780 
cggcgaagcc tgcgaagagt tgcgaggcag cggcctggtg gaacacgcct gggtcaatga 6840 
tgacctggtg cattgcaaac gctagggcct tgtggggtca gttccggctg ggggttcagc 6900 
agccagcgct ttactggcat ttcaggaaca agcgggcact gctcgacgca cttgcttcgc 6960 
tcagtatcgc tcgggacgca cggcgcgctc tacgaactgc cgataaacag aggattaaaa 7020 
ttgacaattg tgattaaggc tcagattcga cggcttggag cggccgacgt gcaggatttc 7080 



cgcgagatcc gattgtcggc cctgaagaaa 
cacgaggaga aaaagcccat ggaggcgttc 
ggcgcctaca tcgacggcga gatcattggg 
aaggacgctc acaaggcgca tctgtccggc 
ggggtcgccg gtatgctgct gcgggcgttg 
cgacagattc caacgggaat ctggtggatg 
tcgctattct ggagcttgtt gtttatttcg 
acggtaggcg ctgtgcagcc gctgatggtc 
ccgatacgat tgatggcggt cctgggggct 
gtgttgacac caaacgcagc gctagatcct 
gtttccatgg cgttcggaac cgtgctgacc 
acctttaccg cctggcaact ggcggccgga 
tttgatccgc caatcccgat gcctacagga 
ctgatcggag cgggtttaac "ctacttcctt 
acagttgttt ccttactggg ctttctcagc 
catcaggccg acagtcggaa cttcgggtcc 
aggggagttg atatcgtcaa cgttcacttc 
cggctttatc cagcgatttc ctattatgtc 
cggttaagcg agaaatgaat aagaaggctg 
tttgatcaca ggcagcaacg ctctgtcatc 
tcatccgtgt ttcaaacccg gcagcttagt 
gagcaaagtc tgccgcctta caacggctct 
gcctgtatcg agtggtgatt ttgtgccgag 
tggcaggata tattgtggtg taaacaaatt 
gacgttttta atgtactggg gtggtttttc 
tgcccttcac cgcctggccc tgagagagtt 
gcaggcgaaa atcctgtttg atggtggttc 
agaatagccc gagatagggt tgagtgttgt 
gaacgtggac tccaacgtca aagggcgaaa 
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gctccagaga tgttcgggtc cgtttacgag 7140 
gctgaacggt tgcgagatgc cgtggcattc 7200 
ctgtcggtct tcaaacagga ggacggcccc 7260 
gttttcgtgg agcccgaaca gcgaggccga 7320 
ccggcgggtt tattgctcgt gatgatcgtc 7380 
cgcatcttca tcctcggcgc acttaatatt 7440 
gtctaccgcc tgccgggcgg ggtcgcggcg 7500 
gtgttcatct ctgccgctct gctaggtagc 7560 
atttgcggaa ctgcgggcgt ggcgctgttg 7620 
gtcggcgtcg cagcgggcct ggcgggggcg 7680 
cgcaagtggc aacctcccgt gcctctgctc 7740 
ggacttctgc tcgttccagt agctttagtg 7800 
accaatgttc tcggcctggc gtggctcggc 7860 
tggttccggg ggatctcgcg* actcgaacct 7920 
cccagatctg gggtcgatca gccggggatg 7980 
ccgacctgta ccattcggtg agcaatggat 8040 
taaagaaata gcgccactca gcttcctcag 8100 
ggcatagttc tcaagatcga cagcctgtca 8160 
ataattcgga tctctgcgag ggagatgata 8220 
gttacaatca acatgctacc ctccgcgaga 8280 
tgccgttctt ccgaatagca tcggtaacat 8340 
cccgctgacg ccgtcccgga ctgatgggct 8400 
ctgccggtcg gggagctgtt ggctggctgg 8460 
gacgcttaga caacttaata acacattgcg 8520 
ttttcaccag tgagacgggc aacagctgat 8580 
gcagcaagcg gtccacgctg gtttgcccca 8640 
cgaaatcggc aaaatccctt ataaatcaaa 8700 
tccagtttgg aacaagagtc cactattaaa 8760 
aaccgtctat cagggcgatg gcccafatacg 8820 
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tgaaccatca 


cccaaatcaa gttttttggg gtcgaggtgc 


cgtaaagcac 


taaatcggaa 


8880 


ccctaaaggg 


agcccccgat ttagagcttg acggggaaag 


ccggcgaacg 


tggcgagaaa 


8940 


ggaagggaag 


aaagcgaaag gagcgggcgc cattcaggct 


gcgcaactgt 


tgggaagggc 


9000 


gatcggtgcg 


ggcctcttcg ctattacgcc agctggcgaa 


agggggatgt 


gctgcaaggc 


9060 


gattaagttg 


ggrtaacgcca gggttttccc agtcacgacg 


ttgtaaaacg 


acggccagtg 9120 


aattaattcc 


catcttgaaa gaaatatagt -ttaaatattt 


attgataaaa 


taacaagtca 9180 


ggtattatag 


tccaagcaaa aacataaatt tattgatgca 


agtttaaatt 


cagaaatatt 


9240 


tcaataactg 


attatatcag ctggtacatt gccgtagatg 


aaagactgag 


tgcgatatta 9300 


. tgtgtaatac 


ataaattgat gatatagcta gcttagctca 


tcgggggatc 


cgtcgaagct 9350 . 


agcttgggtc 


ccgctcagaa gaactcgtca agaaggcgat 


agaaggcgat 


gcgctgcgaa 


■9420 


tcgggagcgg 


cgataccgta aagcacgagg aagcggtcag 


cccattcgcc 


gccaagctct 


9480 


tcagcaatat 


cacgggtagc caacgctatg tcctgatagc 


ggtccgccac 


acccagccgg 


9540 


ccacagtcga 


tgaatccag'a aaagcggcca ttttccacca 


tgatattcgg 


caagcaggca 


9600 


tcgccatggg 


tcacgacgag atcctcgccg tcgggcatgc 


gcgccttgag 


cctggcgaac 


9660 


agttcggctg 


gcgcgagccc ctgatgctct tcgtccagat 


catcctgatc 


gacaagaccg 


9720 


gcttccatcc 


gagtacgtgc tcgctcgatg cgatgtttcg 


cttggtggtc 


gaatgggcag 


9780 


gtagccggat 


caagcgtatg cagccgccgc attgcatcag 


ccatgatgga 


tactttctca 


9840 


gcaggagcaa 


ggtgagatga caggagatcc tgccccggca 


cttcgcccaa 


tagcagccag 


9900 


' tcccttcccg 


cttcagtgac aacgtcgagc acagctgcgc 


• aaggaacgcc 


cgtcgtggcc 


9960- 


i agccacgata. 


gccgcgctgc ctcgtcctgc agttcattca 


gggcaccgga 


caggtcggtc 


10020 


ttgacaaaaa 


gaaccgggcg cccctgcgct gacagccgga 


acacggcggc 


atcagagcag 


10080 


ccgattgtct 


gttgtgccca gtcatagccg aatagcctct 


ccacccaagc 


ggccggagaa 


10140 


cctgcgtgca 


atccatcttg ttcaatccaa gctcccatgg 


gccctcgact 


agagtcgaga 


10200 


tctggattga 


gagtgaatat gagactctaa ttggataccg 


aggggaattt 


atggaacgtc 


10260 


agtggagcat 


ttttgacaag aaatatttgc tagctgatag 


tgaccttagg 


cgacttttga 


10320 


acgcgcaata 


acggcccccg acgcacgcgc cuagcucacu 


oiaac ucc ciy ci 


aacccgcggc 


10380 


tgagtggctc 


cttcaacgtt gcggttctgt cagttccaaa 


cgtaaaacgg 


cttgtcccgc 


10440 


gtcatcggcg 


ggggtcataa cgtgactccc ttaattctcc 


gctcatgatc 


ttgatoccct 


10500 


gcgccatcag 


atccttggcg gcaagaaagc catccagttt 


actttgcagg 


gcttcccaac 


10560 
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cttaccagag 


ggcgccccag ctggcaattc 


_i III ^ m^wmIm a* 

cggttcgctt 


.gctgtccata 


aaaccgccca 


10620 


gtctagctat 


cgccatgtaa gcccactgca 


agctacctgc 


tttctctttg 


cgcttgcgtt 


lUodO 


ttcccttgtc 


cagatagccc agtagctgac 


attcatccgg 


ggtcagcacc 


gtttctgcgg 


10740 


actggctttc 


tacgtgttcc gcttccttta 


gcagcccttg 


cgccctgagt 


gcttgcggca 


10800 


gcgtgaagct 


tgcatgcctg caggtcgacg 


gcgcgccgag 


ctcctcgagc 


aaatttacac 


10860 


attgccacta 


aacgtctaaa cccttgtaat 


ttgtttttgt 


tttactatgt 


gtgttatgta 


10920 


tttgatttgc 


gacaaaccct tacattuggt 


actaaatcta 


taacaccttt 


tatgctaacg 


10980 


tttgccaaca 


cttagcaatt tgcaagttga 


ttaattgatt 


ctaaattatt 


tttgtcttct 


11040 


aaatacatat 


actaabcaac tggaaatgta 


aatatttgct 


aatatttcta 


ctataggaga 


mop 


attaaagtga 


gtgaatatgg taccacaagg 


tttggagatt 


taattgttgc 


aatgctgcat 


11160 


ggatggcata 


tacaccaaac attcaataat 


tcttgaggat 


aataatggta 


ccacacaaga 


11220 


tttgaggtgc 


atgaacgtca cgtggacaaa 


aggtttagta 


atttttcaag 


acaacaatgt 


11280 


taccacacac 


aagttttgag gtgcatgcat 


ggatgccctg 


tggaaagttt 


aaaaatattt 


11340 


tggaaatgat 


ttgcatggaa gccatgtgta 


aaaccatgac 


atccacttgg 


aggatgcaat 


<1 1 >l A A 

11400 


aatgaagaaa 


actacaaatt tacatgcaac 


tagttatgca 


tgtagtctat. 


ataatgagga 


11460 


ttttgcaata 


ctttcattca tdcacactca 


ctaagtttta 


cacgattata 


atttcttcat 


11520 


agccagccca 


ccgcggtggg cggccgcctg 


cagtctagaa 


ggcctcctgc 


tttaatgaga 


11580 


tatgcgagac 


gcctatgatc gcatgatatt 


tgctttcaat 


tctgttgtgc 


acgttgtasia 


11640 


aaacctgagc 


atgtgtagct cagatcctta 


ccgccggttt. 


cggttcattc 


taatgaatat 


11700 


atcacccgtt 


actatcgtat ttttatgaat 


aatattctcc 


gttcaattta 


ctgattgtcc 


11760 


gtcgagcaaa 


tttacacatt gccactaaac 


gtctaaaccc 


ttgtaatttg 


tttttgtttt 


11820 


actatgtgtg 


ttatgtattt gatttgcgat 


aaatttttat 


atttggtact 


aaatttataa 


11880 


caccttttat 


gctaacgttt gccaacactt 


agcaatttgc 


aagttgatta 


attgattcta 


11940 


aattattttt 


gtcttctaaa tacatatact 


aatcaactgg 


aaatgtaaat 


atttgctaat 


12000 


atttctacta 


taggagaatt aaagtgagtg 


aatatggtac 


cacaaggttt 


ggagatttaa 


12060 


ttgttgcaat 


gctgcatgga tggcatatac 


accaaacatt 


caataattct 


tgaggataat 


12120 


aatggtacca 


cacaagattt gaggtgcatg 


aacgtcacgt 


ggacaaaagg 


tttagtaatt 


12180 


tttcsLagaca 


acaatgttac cacacacaag 


ttttgaggtg 


catgcatgga 


tgccctgtgg 


12240 


aaagtttaaa 


aatattttgg aaatgatttg 


catggaagcc 


atgtgtaaaa 


ccatgacatc 


12300 
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cacttggagg 


atgcaataat gaagaaaact 


acaaatttac 


atgcaactag ttatgcatgt 


12360 


agtctatata 


atgaggattt tgcaatactt 


tcattcatac 


acactcacta agttttacac 


12420 


gattataatt 


•tcttcatagc cagcggatcc 


gatatcgggc 


ccgctagcgt taaccctgct 


12480 


ttaatgagat 


atgcgagacg cctatgatcg 


catgatattt 


gctttcaatt ctgttgtgca 12540 


cgttgtaaaa 


aacctgagca tgtgtagctc 


agatccttac 


cgccggtttc ggttcattct 


12600 


aafcgaatata 


tcacccgtta. ctatcgtatt 


tttatgaata 


atattctccg ttcaatttac 


12660 


tgattgtccg 


tcgacgaatt cgagctcggc 


gcgcctctag 


aggatcgatg aattcagatc 


12720 


ggctgagtgg 


ctccttcaac. gttgcggttc 


tgtcagttcc 


aaacgtaaaa cggcttgtcc 


12780 


cgcgt-caucg 


^C^^^^ ^ L> Cl t^ClCiLV.*^ aw u 


ccc t ta.£L b tic 
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tccgctcatg atcagattgt 


12840 


cgtttcccgc 


cttcagttta aactatcagt 


gtttgacagg 


atatattggc gggtaaacct 


12900 


aagagaaaag 


agcgtttatt agaataatcg 


gatatttaaa 


agggcgtgaa aaggtttatc 


12960 


cttcgtccat 


ttgtatgtgc atgccaacca 


cagggttccc 


ca 


13002 
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gatctggcgc cggccagcga gacgagcaag attggccgcc gcccgaaacg atccgacagc 60 
gcgcccagea caggtgcgca ggcaaattgc. accaacgcat acagcgccag cagaatgcca 120 
tagtgggcgg tgacgtcgtt cgagtgaacc agatcgcgca ggaggcccgg cagcaccggc 180 
ataatcaggc cgatgccgac agcgtcgagc gcgacagtgc tcagaattac gatcaggggt 240 
atgttgggtt tcacgtctgg cctccggacc agcctccgct ggtccgattg aacgcgcgga 300 
ttctttatca ctgataagtt ggtggacata ttatgtttat cagtgataaa gtgtcaagca 360 
tgacaaagtt gcagccgaat acagt'gatcc gtgccgccct ggacctgttg aacgaggtcg 420 
gcgtagacgg tctgacgaca cgcaaactgg cggaacggtt gggggttcag cagccggcgc 480 
tttactggca cttcaggaac aagcgggcgc tgctcgacgc actggccgaa gccatgctgg 540 
cggagaatca tacgcattcg gtgccgagag ccgacgacga ctggcgctca tttctgatcg 600 
ggaatgcccg cagcttcagg caggcgctgc tcgcctaccg cgatggqgcg cgcatccatg 660 
ccggcacgcg accgggcgca ccgcagatgg aaacggccga cgcgcagctt cgcttcctct 720 
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gcgaggcggg 


tttttcggcc 


ggggacgccg 


tcaatgcgct 


gatgacaatc 


agctacttca 


780 


ctgttggggc cgtgcttgag 


gagcaggccg 


gcgacagcga 


tgccggcgag 


cgcggcggca 


840 


ccgttgaaca ggctccgctc 


tcgccgctgt 


tgcgggccgc 


gatagacgcc 


.ttcgacgaag 


900 


ccggtccgga cgcagcgttc 


gagcagggac 


tcgcggtgat 


tgtcgatgga 


ttggcgaaaa 


960 


ggaggctcgt 


tgtcaggaac 


gttgaaggac 


cgagaaaggg 


tgacgattga 


tcaggaccgc 


1020 


tgccggagcg caacccactc 


actacagcag 


agccatgtag 


acaacatccc 


ctcccccttt 


1080 


ccaccgcgtc 


agacgcccgt 


agcagcccgc 


tacgggcttt 


ttcatgccct 


gccctagcgt 


1140 


ccaagcctca 


cggccgcgct 


cggcctctct 


ggcggccttc 


tggcgctctt 


ccgcttcctc 


1200 


gctcactgac 


tcgctgcgct 


cggtcgfttcg 


gctgcggcga 


gcggtatcag 


ctcactcaaa 


1260 


ggcggtaata 


cggttatcca 


cagaatcagg 


ggataacgca 


ggaaagaaca 


tgtgagcaaa 


1320 


aggccagcaa 


aaggccagga 


accgtaaaaa 


ggccgcgttg 


ctggcgtttt 


tccataggct 


1380 


ccgcccccct 


gacgagcatc 


acaaaaatcg 


acgctcaagt 


cagaggtggc 


gaaacccgac 


1440 


aggactataa 


agataccagg 


cgtttccccc 


tggaagctcc 


ctcgtgcgct 


ctcctgttcc 


1500 


gaccctgccg 


cttaccggat 


acctgtccgc 


ctttctccct 


tcgggaagcg 


tggcgctttt 


1560 


Gcgctgcata 


accctgcttc 


ggggtcatta 


tagcgatttt 


ttcggtatat 


ccatcctttt 


1620 


tcgcacgata 


tacaggattt 


tgccaaaggg 


ttcgtgtaga 


ctttccttgg 


tgtatccaac 


1680 


ggcgtcagcc 


gggcaggata 


ggtgaagtag 


gcccacccgc 


gagcgggtgt 


tccttcttca 


1740 


ctgtccctta 


ttcgcacctg 


gcggtgctca 


acgggaatcc 


tgctctgcga 


ggctggccgg 


1800 


ctaccgccgg 


cgtaacagat 


gagggcaagc 


ggatggctga 


tgaaaccaag 


ccaaccagga 


1860 


agggcagccc 


acctatcaag 


gtgtactgcc 


ttccagacga 


acgaagagcg 


attgaggaaa 


1920 


aggcggcggc 


ggccggcatg 


agcctgtcgg 


cctacctgct 


ggccgtcggc 


cagggctaca 


1980 


aaatcacggg 


cgtcgtggac 


tatgagcacg 


tccgcgagct 


ggcccgcatc 


aatggcgacc 


2040 


tgggccgcct 


gggcggcctg 


ctgaaactct 


ggctcaccga 


cgacccgcgc 


acggcgcggt 


2100 


tcggtgatgc 


cacgatcctc 


gccctgctgg 


cgaagatcga 


agagaagcag 


gacgagcttg 


2160 


gcaaggtcat 


gatgggcgtg 


gtccgcccga 


gggcagagcc 


atgacttttt 


tagccgctaa 


2220 


aacggccggg 


'gggtgcgcgt 


gattgccaag 


cacgtcccca 


tgcgctccat 


caagaagagc 


2280 


gacttcgcgg 


agctggtgaa 


gtacatcacc 


gacgagcaag 


gcaagaccga 


gcgcctttgc 


.2340 


gacgctcacc 


gggctggttg 


ccctcgccgc 


tgggctggcg 


gccgtctatg 


gccctgcaaa 


2400 


cgcgccagaa 


acgccgtcga 


agccgtgtgc 


gagacaccgc 


ggccgccggc 


gttgtggata 


2460 
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cctcgcggaa 


aacttggccc 


tcactgacag 


cgactcaccc 


ggcgcggcgt 


tgacagatga 


gagctggcca 


gcctcgcaaa 


tcggcgaaaa 


gatgtggaca 


agcctgggga 


taagtgccct 


tgacagatga 


ggggcgcgat 


ccttgacact 


gcacctattg 


acatttgagg 


ggctgtccac 


ccgcccgttt 


ttcggccacc 


gctaacctgt 


aaaccttgtt 


tttaaccagg 


gctgcgccct 


tgccccccct 


tctcgaaccc 


tcccggcccg 


tgcgcccctc 


ggccgcgaac 


ggcctcaccc 


ttgccgggat 


cggggcagta 


acgggatggg 


ttgacgtgcc 


gcaggtgctg 


gcatcgacat 


gcggcctggg 


tggcggcctg 


cccttcactt 


cggggccggc 


aatttttacc 


ttgggcattc 


tgttcggggg 


tgcgataaac 


ccagcgaacc 


gtatgaaaac 


gagaattgga 


cctttacaga 


ctaccaagac 


gaagaggatg 


aagaggatga 


tactgataag 


ataatatatc 


ttttatatag 


ggcaaggcat 


aggcagcgcg 


cttatcaata 


tgcatggact 


aatgcttgaa 


acccaggaca 


attgggtaat 


gactccaact 


tattgatagt 


tgtcatgcag 


ctccaccgat 


tttgagaacg 


gctgcctcag 


attcaggtta 


tgccgctcaa 


gcagctttcc 


cttcaggcgg 


gattcataca 


cgtcaaaggg 


tgacagcagg 


ctcataagac 


atacgtgcgc 


aacaaccgtc 


ttccggagac 


gcgatttagc 


cccgacatag 


ccccactgtt 


tgcccggctg 


tatgcgcgag 


gttaccgact 


cgtgttgagg 


ccaacgccca 


taatgcgggc 



atgaggggcg 


gacgttgaca 


cttgaggggc 


2520 


ggggcaggct 


cgatttcggc 


cggcgacgtg 


2580 


cgcctgattt 


tacgcgagtt 


tcccacagat 


2640 


gcggtattga 


cacttgaggg 


gcgcgactac 


2700 


tgaggggcag 


agtgctgaca 


gatgaggggc 


2760 


aggcagaaaa 


tccagcattt 


gcaagggttt 


2820 


cttttaacct 


gcttttaaac 


caatatttat 


2880 


gtgcgcgtga 


ccgcgcacgc 


cgaagggggg 


2940 


ctaacgcggg 


cctcccatcc 


ccccaggggc 


3000 


caaaaatggc 


agcgctggca 


gtccttgcca 


3060 


cgatcagccc 


gagcgcgacg 


cccggatagca 


3120 


tcagcgacca 


ggtgccgggc 


agtgagggcg 


3180 


cggccgtcgg 


ggcattcacg 


gacttcatgg 


3240 


ttggcatagt 


ggtcgcgggt 


gccgtgctcg 


3300 


atttgaggtg 


ataggtaaga 


ttataccgag 


3360 


attactctat 


gaagcgccat 


atttaaaaag 


3420 


ggaggcagat 


tgccttgaat 


atattgacaa 


3480 


aagatatcgc 


cgtatgtaag 


gatttcaggg 


3540 


tatctataga 


atgggcaaag 


cataaaaact 


3600 


ataaccttat 


agcttgtaaa 


ttctatcata 


3660 


gttttatgtt 


cagataatgc 


ccgatgactt 


3720 


aceCgcgactt 


ccgtcccagc 


cgtgccaggt 


3780 


ttcgctgcgt 


atatcgcttg 


ctgattacgt 


3840 


gcggccagcc 


atccgtcatc 


catatcacca 


3900 


gccccagcgt 


cgccatagtg 


cgttcaccga 


3960 


tgtcatacgc 


gtaaaacagc 


cagcgctggc 


4020 


cgtccatttc 


cgcgcagacg 


atgacgtcac 


4080 


gcggcctgag 


ttttttaagt 


gacgtaaaat 


4140 


tgttgcccgg 


catccaacgc 


cattcatggc 


4200 



catatcaatg attttctggt gcgtaccggg 
ccatgtttta cggcagtgag agcagagata 
acgcaccacc ccgtcagtag ctgaacagga 
agcacctcaa aaacaccatc atacactaaa 
tggtttcaaa.atcggctccg tcgatcictat 
aaaagctgtt .ttctggtatt taaggtttta 
cttgttataa ttagcttctt ggggtatctt 
taaatggcta aaatgagaat atcaccggaa 
gtaaaagata cggaaggaat . gtctcctgct 
aacctatatt taaaaatgac ggacagccgg 
gaaaaggaca tgatgctatg gctggaagga 
gaacggcatg atggctggag caatctgctc: 
gaagagtatg aagatgaaca aagccctgaa 
aggctctttc actccatcga catatcggat 
ttagccgaat tggattactt actgaataac 
gaagaagaca ctccatttaa agatccgcgc 
cccgaagagg aacttgtctt ttcccacggc 
gatggcaaag taagtggctt tattgatctt 
gacattgcct tctgcgtccg gtcgatcagg 
ctattttttg acttactggg gatcaagcct 
ctggatgaat tgttttagta cctagatgtg 
caccgacttc ttccgcatca agtgttttgg 
gggcaagggg tcgctggtat tcgtgcaggg 
cggccagacg gtctacggga ccgacttcat 
ggcaccaggc gggtcaaatc aggaataagg 
cccgcaagga gggtgaatga atcggacgtt 
cgacgcgggg ttttccgccg aggatgccga 
gccccgcgaa accttccagt ccgtcggctc 
gcgcgacagc gtgcaactgg ctccccctgc 
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ttgagaagcg gtgtaagtga actgcagttg 4260 
gcgctgatgt ccggcggtgc ttttgccgtt 4320 
gggacagctg atagacacag aagccactgg 4380 
tcagtaagtt ggcagcatca cccataattg 4440 
gttatacgcc aacttt'gaaa acaactttga 4500 
gaatgcaagg aacagtgaat tggagttcgt; 4560 
taaatactgt agaaaagagg aaggaaataa 4620 
ttgaaaaaac tgatcgaaaa ataccgctgc 4680 
aaggtatata agctggtggg agaaaatgaa 4740 
tataaaggga ccacctatga tgtggaacgg- 4800 
aagctgcctg ttccaaaggt cctgcacttt 4860 
atgagtgagg ccgatggcgt cctttgctcg 4920 
aagattatcg agctgtatgc ggagtgcatc 4980 
tgtccctata cgaatagctt agacagccgc 5040 
gatctggccg atgtggattg cgaaaactgg 5100 
gagctgtatg attttttaaa gacggaaaag 5160 
gacctgggag acagcaacat ctttgtgaaa 5220 
gggagaagcg gcagggcgga caagtggtat 5280 
gaggatatcg gggalagaaca gtatgtcgag 5340 
gattgggaga aaataaaata ttatatttta 5400 
gcgcaacgat gccggcgaca agcaggagcg 5460 
ctctcaggcc gaggcccacg gcaagtattt 5520 
caagattcgg aataccaagt acgagaagga 5580 
tgccgataag gtggattatc tggacaccaa 5640 
gcacattgcc ccggcgtgag tcggggcaat 5700 
tgaccggaag gcatacaggc aagaactgat 5760 
aaccatcgca agccgcaccg tcatgcgtgc 5820 
gatggtccag caagctacgg ccaagatcga 5880 
cctgcccgcg ccatcggccg ccgtggagcg 5940 



ttcgcgtcgt 


ctcgaacagg aggcggcagg 


aggaactatg 


acgaccaaga 


agcgaaaaac 


cgaggccaag 


caggccgcgt 


tgctgaaaca 


ttccttgttc 


gatattgcgc 


cgtggccgga 


ccgctctgcc 


ctgtt caeca 


cgcgcaacaa 


ggtcattttc 


cacgtcaaca aggacgtgaa 


cgacgatgac 


gaactggtgt ggcagcaggt 


cgagccgatc 


accttcacgt 


tctacgagct 


ccggtattac 


acgaaggccg aggaatgcct 


cacgtccgac 


cgcgttgggc 


acctggaatc 


ggaccgtggc 


aagaaaacgt cccgttgcca 


gtttgctggc 


gaccactaca 


cgaaattcat 


ggcccgacgg 


atgttcgact 


atttcagctc 


aaccttccgc 


ctcatgtgcg 


gatcggattc 


cggcgaagcc 


tgcgaagagt 


tgcgaggcag 


tgacctggtg 


cattgcaaac 


gctagggcct 


agccagcgct 


ttactggcat 


ttcaggaaca 


tcagtatcgc 


tcgggacgca 


cggcgcgctc 


ttgacaattg 


tgattaaggc 


tcagattcga 


cgcgagatcc 


gattgtcggc 


cctgaagaaa 


cacgaggaga 


aaaagcccat 


ggaggcgttc 


ggcgcct.aca 


tcgacggcga 


gatcattggg 


aaggacgctc 


acaaggcgca 


tctgtccggc 


ggggtcgccg 


gtatgctgct 


gcgggcgttg 


cgacagattc 


caacgggaat 


ctggtggatg 


tcgctattct 


ggagcttgtt 


gtttatttcg 


acggtaggcg 


ctgtgcagcc 


gctgatggtc 


ccgatacgat 


tgatggcggt 


cctgggggct 


gtgttgacac 


caaacgcagc 


gctagatcct 
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tttggcgaag tcgatgacca 


tcgacacgcg 


6000 


cgccggcgag gacctggceia 


aacaggtcag 


6060 


cacgaagcag cagatcaagg 


aaatgcagct 


6120 


cacgatgcga gcgatgccaa 


acgacacggc 


6180 


gaaaatcccg cgcgaggcgc 


tgcaaaacaa 


6240 


gatcacctac accggcgtcg 


agctgcgggc 


6300 


gttggagtac gcgaagcgca 


cccctatcgg 


6360 


ttgccaggac ctgggctggt 


cgatcaatgg 


6420 


gtcgcgccta caggcgacgg 


cgatgggctt 


6480 


ggtgtcgctg ctgcaccgct 


tccgcgtcct 


6540 


ggtcctgatc gacgaggaaa 


tcgtcgtgct' 


6600 


atgggagaag taccgcaagc 


tgtcgccgac 


6660 


gcaccgggag ccgtacccgc 


tcaagctgga 


6720 


cacccgcgtg aagaagtggc 


gcgagcaggt 


6780 


cggcctggtg gaacacgcct 


gggtcaatga 


6840 


tgtggggtca gttccggctg 


ggggttcagc 


6900 


agcgggcact gctcgacgca 


cttgcttcgc 


6960 


tacgaactgc cgataeiacag 


aggattaaaa 


7020 


cggcttggag cggccgacgt 


gcaggatttc 


7080 


gctccagaga tgttcgggtc 


cgtttacgag 


7140 


gctgaacggt tgcgagatgc 


cgtggcattc 


7200 


ctgtcggtct tcaaacagga 


ggacggcccc 


7260 


gttttcgtgg agcccgaaca 


gcgaggccga 


7320 


ccggcgggtt tattgctcgt 


gatgatcgtc 


7380 


cgcatcttca tcctcggcgc 


acttaatatt 


7440 


gtctaccgcc tgccgggcgg 


ggtcgcggcg 


7500 


gtgttcatct ctgccgctct 


gctaggtagc 


7560 


atttgcggaa ctgcgggcgt 


ggcgctgttg 


7620 


gtcggcgtcg cagcgggcct 


ggcgggggcg 


7680 



73 



gtttccatgg cgttcggaac cgtgctgacc 
acctttaccg cctggcaact ggcggccgga 
tttgatccgc caatcccgat gcctacagga 
ctgatcggag cgggtttaac ctacttcctt 
acagttgttt ccttactggg ctttctcagc 
catcaggccg acagtcggaa cttcgggtcc 
aggggagttg atatcgtcaa cgttcacttc 
cggctttatc cagcgatttc ctattatgtc 
cggttaagcg agaaatgaat aagaaggctg 
tttgatcaca ggcagcaacg ctctgtcatc 
tcatccgtgt ttcaaacccg gcagcttagt 
gagcaaagtc tgccgcctta caacggctct 
gcctgtatcg agtggtgatt ttgtgccgag 
tggcaggata tattgtggtg taaacaaatt 
gacgttttta atgtactggg gtggtttttc 
tgcccttcac cgcctggccc tgagagagtt 
gcaggcgaaa atcctgtttg atggtggttc 
agaatagccc gagatagggt tgagtgttgt 
gaacgtggac tccaacgtca aagggcgaaa 
tgaaccatca cccaaatcaa gttttttggg 
ccctaaaggg agcccccgat ttagagcttg 
ggaagggaag aaagcgaaag gagcgggcgc 
gatcggtgcg ggcctcttcg ctattacgcc 
gattaagttg ggtaacgcca gggttttccc 
aattaattcc catcttgaaa gaaatatagt 
ggtattatag tccaagcaaa aacataaatt 
tcaataactg attatatcag ctggtacatt 
tgtgtaatac ataaattgat gatatagcta 
agcttgggtc ccgctcagaa gaactcgtca 



cgcaagtggc aacctcccgt gcctctgctc 


7740 


ggacttctgc tcgttccagt agctttagtg 


7800 


accaatgttc tcggcctggc 


gtggctcggc 


7860 


tggttccgggggatctcgcg actcgaacct 


7920 


cccagatctg gggtcgatca gccggggatg 


7980 


ccgacctgta ccattcggtg agcaatggat 


8040 


taaagaaata gcgccactca gcttcctcag 


8100 


ggcatagttc tcaagatcga 


cagcctgtca 


8160 


ataattcgga tctctgcgag 


ggagatgata 


8220 


gttacaatca acatgctacc 


ctccgcgaga 


8280 


tgccgttctt ccgaatagca 


tcggtaacat 


8340 


cccgctgacg ccgtcccgga 


ctgatgggct 


8400 


ctgccggtcg gggagctgtt 


ggctggctgg 


8460 


gacgcttaga caacttaata 


acacattgcg 


8520 


ttttcaccag tgagacgggc 


aacagctgat 


8580 


gcagcaagcg gtccacgctg 


gtttgcccca 


8640 


cgaaatcggc aaaatccctt 


ataaatcaaa 


8700 


tccagtttgg aacaagagtc 


cactattaaa 


8760 


aaccgtctat cagggcgatg 


gcccactacg 


8820 


gtcgaggtgc cgtaaagcac 


taaatcggaa 


8880 


acggggaaag ccggcgaacg 


tggcgagaaa 


8940 


cattcaggct gcgcaactgt 


tgggaagggc 


9000 


agctggcgaa agggggatgt 


gctgcaaggc 


9060 


agtcacgacg ttgtaaaacg 


acggccagtg 


9120 


ttaaatattt attgataaaa 


taacaagtca 


9180 


tattgatgca agtttaaatt 


cagaaatatt 


9240 


gccgtagatg aaagactgag 


tgcgatatta 


9300 


gcttagctca tcgggggatc 


cgtcgaagct 


9360 


agaaggcgat agaaggcgat 


gcgctgcgaa 


9420 
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tcgggagcgg cgataccgta aagcacgagg aagcggtcag cccattcgcc gccaagctct 9480 
tcagcaatat cacgggtagc caacgctatg tcctgatagc ggtccgccac acccagccgg 9540 
ccacagtcga tgaatccaga aaagcggcca ttttccacca tgatattcgg caagcaggca 9600 
tcgccatggg tcacgacgag atcctcgccg tcgggcatgc gcgccttgag cctggcgaac 9660 
agttcggctg gcgcgagccc ctgatgctct tcgtccagat catcctgatc gacaagaccg 9720 
gcttccatcc gagtacgtgc tcgctcgatg cgatgtttcg cttggtggtc gaatgggcag 9780 
gtagccggat caagcgtatg cagccgccgc attgcatcag ccatgatgga tactttctcg 9840 
gcaggagcaa ggtgagatga caggagatcc tgccccggca cttcgcccaa tagcagccag 9900 
tcccttcccg cttcagtgac aacgtcgagc acagctgcgc aaggaacgcc cgtcgtggcc 9960 
agccacgata gccgcgctgc ctcgtcctgc agttcattca gggcaccgga caggtcggtc 10020 
ttgacaaaaa gaaccgggcg cccctgcgct gacagccgga acacggcggc atcagagcag 10080 
ccgattgtct gttgtgccca gtcatagccg aatagcctct ccacccaagc ggccggagaa 10140 
cctgcgtgca atccatcttg ttcaatccaa gctcccatgg gccctcgact agagtcgaga 10200 
tctggattga gagtgaatat gagactctaa ttggataccg aggggaattt atggaacgtc 10260 
agtggagcat ttttgacaag aaatatttgc tagctgatag tgaccttagg cgacttttga 10320 
acgcgcaata atggtttctg acgtatgtgc ttagctcatt aaactccaga aacccgcggc 10380 
tgagtggctc cttcaacgtt gcggttctgt cagttccaaa cgtaaaacgg cttgtcccgc 10440 
gtcatcggcg ggggtcataa cgtgactccc ttaattctcc gctcatgatc ttgatcccct 10500 
gcgccatcag atccttggcg gcaagaaagc catccagttt actttgcagg gcttcccaac 10560 
cttaccagag ggcgccccag ctggcaattc cggttcgctt gctgtccata aaaccgccca 10620 
gtctagctat cgccatgtaa gcccactgca agctacctgc tttctctttg cgcttgcgtt 10680 
ttcccttgtc cagatagccc agtagctgac attcatccgg ggtcagcacc gtttctgcgg 10740 
actggctttc tacgtgttcc gcttccttta gcagcccttg cgccctgagt gcttgqggca 10800 
gcgtgaagct tgcatgcctg caggtcgacg gcgcgccgag ctcctcgagc aaatttacac 10860 
attgccacta aacgtctaaa cccttgtaat ttgtttttgt tttactatgt gtgttatgta 10920 
tttgatttgc gataaatttt tatatttggt actaaattta taacaccttt tatgctaacg 10980 
tttgccaaca cttagcaatt tgcaagttga ttaattgatt ctaaattatt tttgtcttct 11040 
aaatacatat actaatcaac tggaaatgta aatatttgct aatatttcta ctataggaga 11100 
attaaagtga gtgaatatgg taccacaagg tttggagatt taattgttgc aatgctgcat 11160 
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ggatggcata 


tacaccaaac 


attcaataat 


tcttgaggat 


aataatggta 


ccacacaaga 


11220 


tttgaggtgc 


atgaacgtca 


cgtggacaaa 


aggtttagta 


atttttcaag 


acaacaatgt 


11280 


taccacacac 


aagttttgag 


gtgcatgcat 


ggatgccctg 


tggaaagttt 


aaaaatattt 


11340 


tggaaatgat 


ttgcatggaa 


gccatgtgta 


aaaccatgac 


atccacttgg 


aggatgcaat 


11400 


ciatgaagaaa 


actacaaatt 


tacatgcaac 


tagttatgca 


tgtagtctat 


ataatgagga 11460 


ttttgcaata 


ctttcattca 


tacacactca 


ctaagtttta 


cacgattata 


atttcttcat 


11520 


agccagccca 


ccgcggtggg 


cggccgcctg 


cagtctagaa 


ggcctcctgc 


tttaatgaga 


11580 


tatgcgagac 


gcctatgatc 


■gcatgatatt 


tgctttcaiat 


tctgttgtgc 


acgttgtaaa 


11640 


aaacctgagc 


atgtgtagct 


cagatcctta 


ccgccggttt 


cggttcattc 


taatgaatat 


11700 


atcacccgtt 


actatcgtat 


ttttatgaat 


aatattctcc 


gttcaattta 


ctgattgtcc- 


11760 


gtcgagcaaa 


tttacacatt 


gccactaaac 


gtctaaaccc 


ttgtaatttg 


tttttgtttt 


11820 


actatgtgtg 


ttatgtattt 


gatttgcgat 


aaatttttat 


atttggtact 


aaatttataa 


11880 


caccttttat 


gctaacgttt 


gccaacactt 


agcaatttgc 


aagttgatta 


attgattcta 


11940 


aattattttt 


gtcttctaaa 


tacatatact 


aatcaactgg 


aaatgtaaat 


atttgctaat 


12000 


atttctacta 


taggagaatt 


aaagtgagtg 


aatatggtac 


cacaaggttt 


ggagatttaa 


•12060 


ttgttgcaat 


gctgcatgga 


tggcatatac 


accaaacatt 


caataattct 


tgaggataat 


12120 


aatggCacca 


cacaagattt 


gaggtgcatg 


aacgtcacgt 


ggacaaaagg 


tttagtaatt 


12180 


tttcaagaca 


acaatgttac 


cacacacaag 


ttttgaggtg 


catgcatgga 


tgccctgtgg 


12240 


aaagtttaaa 


aatattttgg 


aaatgatttg 


catggaagcc 


atgtgtaaaa 


ccatgacatc 


12300 


cacttggagg 


atgcaataat 


gaagaaaact 


acaaatttac 


atgcaactag 


ttatgcatgt 


12360 


agtctatata 


atgaggattt 


tgcaatactt' 


tcattcatac 


acactcacta 


agttttacac 


12420 


gattataatt 


tcttcatagc 


cagcggatcc 


gatatcgggc 


ccgctagcgt 


taaccctgct 


12480 


ttaatgagat 


atgcgagacg 


cctatgatcg 


catgatattt 


gctttcaatt 


ctgttgtgca 


12540 


cgttgtaaaa 


aacctgagca 


tgtgtagctc 


agatccttac 


cgccggtttc 


ggttcattct 


12600 


aatgaatata 


tcacccgtta 


ctatcgtatt 


tttatgaata 


atattctccg 


ttcaatttac 


12660 


tgattgtccg 


tcgagcaaat 


ttacacattg 


ccactaaacg 


tctaaaccct 


tgtaatttgt 


12720 


ttttgtttta 


ctatgtgtgt 


tatgtatttg 


atttgcgata 


aatttttata 


tttggtacta 


12780 


aatttataac 


accttttatg 


ctaacgtttg 


ccaacactta 


gcaatttgca 


agttgattaa 


12840 


ttgattctaa 


attatttttg 


tcttctaaat 


acatatacta 


atcaactgga 


aatgtaaata 


12900 
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tttgctaata 


tttctactat 


aggagaatta 


aagtgagtga 


atatggtacc 


acaaggtttg 12960 


gagatttaat 


tgttgcaatg 


ctgcatggat 


ggcatataca 


ccaaacattc 


aataattctt 


13020 


gaggataata 


atggtaccac 


acaagatttg 


aggtgcatga 


acgtcacgtg 


gacaaaaggt 


13080 


ttagtaattt 


ttcaagacaa 


caatgttacc 


acacacaagt 


tttgaggtgc 


atgcatggat 


13140 


gccctgtgga 


aagtttaaaa 


atattttgga 


aatgatttgc 


atggaagcca 


tgtgtaaaac 


13200 


catgacatcc 


acttggagga 


tgcaataatg 


aagaaaacta 


caaatttaca 


tgcaactagt , 


.13260 


tatgcatgta 


gtctatataa 


tgaggatttt 


gcaatacttt 


cattcataca 


oactcactaa 


13320 


gttttacacg 


attataattt 


cttcatagcc 


agcagatctg 


ccggcatcga 


tcccgggcca 


13380 


tggcctgctt 


taatgagata 


tgcgagacgc 


ctatgatcgc 


atgatatttg 


ctttcaattc 


13440' 


tgttgtgcac 


gttgtaaaaa 


acctgagcat 


gtgtagctca 


gatccttacc 


gccggtttcg 13500 


gttcattcta 


atgaatatat 


cacccgttac 


tatcgtattt 


ttatgaataa 


tattctccgt 


13560 


tcaatttact 


gattgtccgt 


cgacgagctc 


ggcgcgcctc 


tagaggatcg 


atgaattcag 


13620 


atcggctgag 


tggctccttc 


aacgttgcgg 


ttctgtcagt 


tccaaacgta 


aaacggcttg 13680 


tcccgcgtca 


tcggcggggg 


tcataacgtg 


actcccttaa 


ttctccgctc 


atgatcagat 


13740 


tgtcgtttcc 


cgccttcagt 


ttaaactatc 


agtgtttgac 


aggatatatt 


ggcgggtaaa 


13800 


cctaagagaa 


aagagcgttt 


attagaataa 


tcggatattt 


aaaagggcgt 


gaaaaggttt 


13860 


atccttcgtc 


catttgtatg 


tgcatgccaa 


ccacagggtt 


cQcca 




13905 
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gatctggcgc cggccagcga gacgagcaag attggccgcc gcccgaaacg atccgacagc 60 
gcgcccagca caggtgcgca ggcaaattgc accaacgcat acagcgccag cagaatgcca 120 
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tagtgggcgg 


tgacgtcgtt 


cgagtgaacc 


agatcgcgca 


ggaggcccgg 


cagcaccggc 


180 


ataatcaggc 


cgatgccgac 


agcgtcgagc 


gcgacagtgc 


tcagaattac 


gatcaggggt 


240 


atgttgggtt 


tcacgtctgg 


cctccggacc 


agcctccgct 


ggtccgattg 


aacgcgcgga 


300 


ttctttatca 


ctgataagtt 


ggtggacata 


ttatgtttat 


cagtgataaa 


gtgtcaagca 


360 


tgacaaagtt 


gcagccgaat 


acagtgatcc 


gtgccgccct 


ggacctgttg 


aacgaggtcg 


420 


gcgtagacgg 


tctgacgaca 


cgcaaactgg 


cggaacggtt 


gggggttcag 


cagccggcgc 


480 


tttactggca 


cttcaggaac 


aagcgggcgc 


tgctcgacgc 


actggccgaa 


gccatgctgg 


540 


cggagaatca 


tacgcattcg 


gtgccgagag 


ccgacgacga 


ctggcgctca 


tttctgatcg 


600 


ggaatgcccg 


cagcttcagg 


caggcgctgc 


tcgcctaccg 


cgatggcgcg 


cgcatccatg 


660 


ccggcacgcg 


accgggcgca 


Cdgcagatgg 


aaacggccga 


cgcgcagctt 


cgcttcctct 


720 


gcgaggcggg 


tttttcggcc 


ggggacgccg 


tcaatgcgct 


gatgacaatc 


agctacttca 


780 


ctgttggggc 


cgtgcttgag 


gagcaggccg 


gcgacagcga 


tgccggcgag 


cgcggcggca 


840 


ccgttgaaca 


ggctccgctc 


tcgccgctgt 


tgcgggccgc 


gatagacgcc 


ttcgacgaag 


900 


ccggtccgga 


cgcagcgttc 


gagcagggac 


tcgcggtgat 


tgtcgatgga 


ttggcgaaaa 


960 


ggaggctcgt 


tgtcaggaac 


gttgaaggac 


cgagaaaggg 


tgacgattga 


tcaggaccgc 


1020 


tgccggagcg 


caacccactc 


actacagcag 


agccatgtag 


acaacatccc 


ctcccccttt 


1080 


ccaccgcgtc 


agacgcccgt 


agcagcccgc 


tacgggcttt 


ttcatgccct 


gccctagcgt 


1140 


ccaagcctca 


cggccgcgct 


cggcctctct 


ggcggccttc 


tggcgctctt 


ccgcttcctc 


1200 


gctcactgac 


tcgctgcgct 


cggtcgttcg 


gctgcggcga 


gcggtatcag 


ctcactcaaa 


1260 


ggcggtaata 


cggttatcca 


cagaatcagg 


ggataacgca 


ggaaagaaca 


tgtgagcaaa 


1320 


aggccagcaa 


eiaggccagga 


accgtaaaaa 


ggccgcgttg 


ctggcgtttt 


tccataggct 


1380 


ccgcccccct 


gacgagcatc 


acaaaaatcg 


acgctcaagt 


cagaggtggc 


gaaacccgac 


1440 


aggactataa 


agataccagg 


cgtttccccc 


tggaagctcc 


ctcgtgcgct 


ctcctgttcc 


1500 


gaccctgccg 


cttaccggat 


acctgtccgc 


ctttctccct 


tcgggaagcg 


tggcgctttt 


1560 


ccgctgcata 


accctgcttc 


ggggtcatta 


tagcgatttt 


ttcggtatat 


ccatcctttt 


1620 


tcgcacgata 


tacaggattt 


tgccaaaggg 


ttcgtgtaga 


ctttccttgg 


tgtatccaac 


1680 


ggcgtcagcc 


gggcaggata 


ggtgaagtag 


gcccacccgc 


gagcgggtgt 


tccttcttca 


1740 


ctgtccctta 


ttcgcacctg 


gcggtgctca 


acgggaatcc 


tgctctgcga 


ggctggccgg 


1800 


ctaccgccgg 


cgtaacagat 


gagggcaagc 


ggatggctga 


tgaaaccaag 


ccaaccagga 


1860 
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agggcagccc acctatcaag gtgtaotgcc ttccagacga acgaagagcg attgaggaaa 1920 
aggcggcggc ggccggcatg agcctgtcgg cctacctgct ggccgtcggc cagggctaca 1980 
aaatcacggg cgtcgtggac tatgagcacg tccgcgagct ggcccgcatc aatggcgacc 2040 
tgggccgcct gggcggcctg ctgaaactct ggctcaccga cgacccgcgc acggcgcggt 2100 
tcggtgatgc cacgatcctc gccctgctgg cgaagatcga agagaagcag gacgagcttg 2160 
gcaaggtcat gatgggcgtg gtccgcccga gggcagagcc atgacttttt tagccgctaa 2220 
aacggccggg gggtgcgcgt gattgccaag cacgtcccca tgcgctccat caagaagagc 2289 
gacttcgcgg agctggtga^ gtacatcacc gacgagcaag gcaagaccga gcgcctttgc 2340 
gacgctcacc gggctggttg ccctcgccgc tgggctggcg gccgtctatg gccctgcaaa 2400 
cgcgccagaa acgccgtcga agccgtgtgc gagacaccgc ggccgccggc gttgtggata 2460 
cctcgcggaa aacttggccc tcactgacag atgaggggcg gacgttgaca cttgaggggc 2520 
cgactcaccc ggcgcggcgt tgacagatga ggggcaggct cgatttcggc cggcgacgtg 2580 
gagctggcca gcctcgcaaa tcggcgaaaa cgcctgattt tacgcgagtt tcccacagat 2640 
gatgtggaca agcctgggga taagtgccct gcggtattga cacttgaggg gcgcgactac 2700 
tgacagatga ggggcgcgat ccttgacact tgaggggcag agtgctgaca gatgaggggc 2760 
gcacctattg acatttgagg ggctgtccac aggcagaaaa tccagcattt gcaagggttt 2820 
ccgcccgttt ttcggccacc gctaacctgt cttttaacct gcttttaaac caatatttat 2880 
aaaccttgtt tttaaccagg gctgcgccct gtgcgcgtga ccgcgcacgc cgaagggggg 2940 
.tgccccccct tctcgaaccc tcccggcccg ctaacgcggg cctcccatcc ccccaggggc 3000 
. tgcgcccctc ggccgcgaac ggcctcaccc caaaaatggc agcgctggca gtccttgcca 3060 
ttgccgggat cggggcagta acgggatggg cgatcagccc gagcgcgacg cccggaagca 3120 
ttgacgtgcc gcaggtgctg gcatcgacat tcagcgacca ggtgccgggc agtgagggcg 3180 
gcggcctggg tggcggcctg cccttcactt cggccgtcgg ggcattcacg gacttcatgg 3240 
cggggccggc aatttttacc ttgggcattc ttggcatagt ggtcgcgggt gccgtgctcg 3300 
tgttcggggg tgcgataaac ccagcgaacc atttgaggtg ataggtaaga ttataccgag 3360 
gtatgaaaac gagaattgga cctttacaga attactctat gaagcgccat atttaaaaag 3420 
ctaccaagac gaagaggatg aagaggatga ggaggcagat tgccttgaat atattgacaa 3480 
tactgataag ataatatatc ttttatatag aagatatcgc cgtatgtaag gatttcaggg 3540 
ggcaaggcat aggcagcgcg cttatcaata tatctataga atgggcaaag cataaaaact 3600 
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tgcatggact 


aatgcttgaa 


acccaggaca 


ataaccttat 


agcttgtaaa 


ttctatcata 


3660 


attgggtaat 


gactccaact 


tattgatagt 


gttttatgtt 


cagataatgc 


ccgatgactt 


3720 


tgtcatgcag 


ctccaccgat 


tttgagaacg 


acagcgactt 


ccgtcccagc 


cgtgccaggt 


3780 


gctgcctcag 


attcaggtta 


tgccgctcaa 


ttcgctgcgt 


atatcgcttg 


ctgattacgt 


3840 


gcagctttcc 


cttcaggcgg 


gattcataca 


gcggccagcc 


atccgtcatc 


catatcacca 


3900 


cgtcaaaggg 


tgacagcagg 


ctcataagac 


gccccagcgt 


cgccatagtg 


cgttcaccga 


3960 


atacgtgcgc 


aacaaccgtc 


ttccggagac 


tgtcatacgc 


gtaaaacagc 


cagcgctggc 


4020 


gcgatttagc 


cccgacatag 


ccccactgtt 


cgtccatttc 


cgcgcagacg 


atgacgtcac 


4080 


tgcccggctg 


tatgcgcgag 


gttaccgact 


gcggcctgag 


ttttbtaagt. 


gacgtaaaat 


4140 


cgtgttgagg 


ccaacgccca 


taatgcgggc 


tgttgcccgg 


catccaacgc 


cattcatggc 


4200 


catatcaatg 


attttctggt 


gcgtaccggg 


ttgagaagcg 


gtgtaagtga 


actgcagttg 


4260 


ccatgtttta 


cggcagtgag 


agcagagata 


gcgctgatgt 


ccggcggtgc 


ttttgccgtt 


4320 


acgcaccacc 


ccgtcagtag 


ctgaacagga 


gggacagctg 


atagacacag 


aagccactgg 


4380 


agcacctcaa 


aaacaccatc 


atacactaaa 


tcagtaagtt 


ggcagcatca 


cccataattg 


4440 


tggtttcaaa 


atcggctccg 


tcgatactat 


gttatacgcc 


aactttgaaa 


acaactttga 


4500 


aaaagctgtt 


ttctggtatt 


taaggtttta 


gaatgcaagg 


aacagtgaat 


tggagttcgt 


4560 


cttgttataa 


ttagcttctt 


ggggtatctt 


taaatactgt 


agaaaagagg 


aaggaaataa 


4620 


taaatggcta 


aaatgagaat 


atcaccggaa 


ttgaaaaaac 


tgatcgaaaa 


ataccgctgc 


4680 


gtaaaagata 


cggaaggaat 


gtctcctgct 


aaggtatata 


agctggtggg 


agaaaatgaa 


4740 


aacctatatt 


taaaaatgac 


ggacagccgg 


tataaaggga 


ccacctatga 


tgtggaacgg 


4800 


gaaaaggaca 


tgatgctatg 


gctggaagga 


aagctgcctg 


ttccaaaggt 


cctgcacttt 


4860 


gaacggcatg 


atggctggag 


caatctgctc 


atgagtgagg 


ccgatggcgt 


cctttgctcg 


4920 


gaagagtatg 


aagatgaaca 


aagccctgaa 


aagattatcg 


agctgtatgc 


ggagtgcatc 


4980 


aggctctttc 


actccatcga 


catatcggat 


tgtccctata 


cgaatagctt 


agacagccgc 


5040 


ttagccgaat 


tggattactt 


actgaataac 


gatctggccg 


atgtggattg 


cgaaaactgg 


5100 


gaagaagaca 


ctccatttaa 


agatccgcgc 


gagctgtatg 


attttttaaa 


gacggaaaag 


5160 


cccgaagagg 


aacttgtctt 


ttcccacggc 


gacctgggag 


acagcaacat 


ctttgtgaaa 


5220 


gatggcaaag taagtggctt 


tattgatctt 


gggagaagcg 


gcagggcgga 


caagtggtat 


5280 


gacattgcct 


tctgcgtccg 


gtcgatcagg 


gaggatatcg 


gggaagaaca 


gtatgtcgag 


5340 
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ctattttttg 


acttactggg 


gatcaagcct gattgggaga 


aaataaaata 


ttatatttta 


5400 


ctggatgaat 


tgttttagta 


cctagatgtg gcgcaacgat 


gccggcgaca 


agcaggagcg 


5460 


caiccgacttc 


ttccgcatca 


agtgttttgg ctctcaggcc 


gaggcccacg 


gcaagtattt 


5520 


gggcaagggg 


tcgctggtat 


tcgtgcaggg caagattcgg 


aataccaagt 


acgagaagga 


5580 


cggccagacg 


gtctacggga 


ccgacttcat tgccgataag 


gtggattatc 


tggacaccaa 


5640 


ggcaccaggc 


gggtcaaatc 


aggaataagg gcacattgcc 


ccggcgftgag 


tcggggcaat 


5700 


cccgcaagga 


gggtgaatga 


atcggacgtt tgaccggaag 


gcatacaggc 


aagaactgat 


5760 


cgacgcgggg 


ttttccgccg 


aggatgccga aaccatcgca 


agccgcaccg 


tcatgcgtgc 


5820 


gccccgcgaa 


accttccagt 


ccgtcggctc gatggtccag 


caagctacgg 


ccaagaitcga 


5880 


gcgcgacagc • 


gtgcaactgg 


ctccccctgc cctgcccgcg 


ccatcggccg 


ccgtggagcg 


5940 


ttcgcgtcgt 


ctcgaacagg 


aggcggcagg tttggcgaag 


tcgatgacca 


tcgacacgcg 


6000 


aggaactatg 


acgaccaaga 


agcgaaaaac cgccggcgag 


gacctggcaa 


aacaggtcag 


6060 


cgaggccaag 


caggccgcgt 


tgctgaaaca cacgaagcag 


cagatcaagg 


aaatgcagct 


6120 


ttccttgttc 


gatattgcgc 


cgtggccgga cacgatgcga 


gcgatgccaa 


acgacacggc 


6180 


ccgctctgcc 


ctgttcacca 


cgcgcaacaa gaaaatcccg 


cgcgaggcgc 


tgcaaaacaa 


6240 


ggtcattttc 


cacgtcaaca 


aggacgtgaa gatcacctac 


•accggcgtcg 


agctgcgggc 


6300 


cgacgatgac 


gaactggtgt 


ggcagcaggt gttggagtac 


gcgaagcgca 


cccctatcgg 


6360 


cgagccgatc 


accttcacgt 


tctacgagct ttgccaggac 


ctgggctggt 


cgatcaatgg 


6420 


ccggtattac 


acgaaggccg 


aggaatgcct gtcgcgccta 


caggcgacgg 


cgatgggctt 


6480 


cacgtccgac 


cgcgttgggc 


acctggaatc ggtgtcgctg 


ctgcaccgct 


tccgcgtcct 


6540 


ggaccgtggc 


aagaaaacgt 


cccgttgcca ggtcctgatc 


gacgaggaaa 


tcgtcgtgct 


6600 


gtttgctggc 


gaccactaca 


cgaaattcat atgggagaag 


taccgcaagc 


tgtcgccgac 


6660 


ggc.ccgacgg atgttcgact 


atttcagctc gcaccgggag 


ccgtacccgc 


tcaagctgga 


6720 


aaccttccgc 


ctcatgtgcg 


gatcggattc cacccgcgtg 


aagaagtggc 


gcgagcaggt 


6780 


cggcgaagcc 


tgcgaagagt 


tgcgaggcag cggcctggtg 


gaacacgcct 


gggtcaatga 


6840 


tgacctggtg cattgcaaac 


gctagggcct tgtggggtca 


gttccggctg 


ggggttcagc 


6900 


agccagcgct 


ttactggcat 


ttcaggaaca agcgggcact 


gctcgacgca 


cttgcttcgc 


6960 


tcagtatcgc 


tcgggacgca 


cggcgcgctc tacgaactgc 


cgataaacag 


aggattaaaa 


7020 


ttgacaattg 


tgattaaggc 


tcagattcga cggcttggag 


cggccgacgt 


gcaggatttc 


7080 
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cgcgagatcc 


gattgtcggc 


cctgaagaaa 


gctccagaga tgttcgggtc 


cgtttacgag 


7140 


cacgaggaga 


aaaagcccat 


ggaggcgttc 


gctgaacggt tgcgagatgc 


cgtggcattc 


7200 


ggcgcctaca 


tcgacggcga 


gatcattggg 


ctgtcggtct tcaaacagga 


ggacggcccc 


726*0 


aaggacgctc 


acaaggcgca 


tctgtccggc 


gttttcgtgg agcccgaaca 


gcgaggccga 


7320 


ggggtcgccg 


gtatgctgct 


gcgggcgttg 


ccggcgggtt tattgctcgt 


gatgatcgtc 


7380 


cgacagattc- 


caacgggaat 


ctggtggatg 


cgcatcttca tcctcggcgc 


acttaatatt 


7440 


tcgctattct 


ggagcttgtt 


gtttatttcg 


gtctaccgcc tgccgggcgg 


ggtcgcggcg 


7500 


acggtaggcg 


ctgtgcagcc 


gctgatggtc 


gtgttcatct* ctgccgctct 


gctaggtagc 


7560 


ccgatacgat 


jbgatggcggt 


cctgggggct 


atttgcggaa ctgcgggcgt 


ggcgctgttg 


7620 


gtgttgacac 


caaacgcaigc 


gctagatcct 


gtcggcgtcg cagcgggcct 


ggcgggggcg 


7680 


gtttccatgg 


cgttcggaac 


cgtgctgacc 


cgcaagtggc aacctcccgt 


gcctctgctc 


7740 


acctttaccg 


cctggcaact 


ggcggccgga 


ggacttctgc tcgttccagt 


agctttagtg 


7800 


tttgatccgc 


caatcccgat 


gcctacagga 


accaatgttc tcggcctggc 


gtggctcg'gc 


7860 


ctgatcggag 


cgggtttaac 


ctacttcctt 


tggttccggg ggatctcgcg 


actcgaacct 


7920 


acagttgttt 


ccttactggg 


ctttctcagc 


cccagatctg gggtcgatca 


gccggggatg 


7980 


catcaggccg 


acagtcggaa 


cttcgggtcc 


ccgacctgta ccattcggtg 


agcaatggat 


8040 


aggggagttg 


atatcgtcaa 


cgttcacttc 


taaagaaata gcgccactca 


gcttcctcag 


8100 


cggctttatc 


cagcgatttc 


ctattatgtc 


ggcatagttc tcaagatcga 


cagcctgtca 


8160 


cggttaageg 


agaaatgaat 


^agaaggctg 


ataattcgga tctctgcgag 


ggagatgata 


8220 


tttgatcaca 


ggcagcaacg 


ctctgtcatc 


gttacaatca acatgctacc 


ctccgcgaga 


8280 


tcatccgtgt 


ttcaaacccg 


gcagcttagt 


tgccgttctt ccgaatagca 


tcggtaacat 


8340 


gagcaaagtc 


tgccgcctta 


caacggctct 


cccgctgacg ccgtcccgga 


ctgatgggct 


8400 


gcctgtatcg 


agtggtgatt 


ttgtgccgag 


ctgccggtcg gggagctgtt 


ggctggctgg 


8460 


tggcaggata 


tattgtggtg 


taaacaaatt 


gacgcttaga caacttaata 


acacattgcg 


8520 


craccr 1 1 1 1 ta 


a. t cr t ac ticfGrcr 


Qtcrcrtttttc 


ti ti t tcac cacT t cacraco'crcrc 


aac acre tio'a t 


8580 


tgcccttcac 


cgcctggccc 


tgagagagtt 


gcagcaagcg gtccacgctg 


gtttgcccca 


8640 


gcaggcgaeia 


atcctgtttg 


atggtggttc 


cgaaatcggc aaaatccctt 


ataaatcaaa 


8700 


agaatagccc 


gagatagggt 


tgagtgttgt 


tccagtttgg aacaagagtc 


cactattaaa 


8760 


gaacgtggac 


tccaacgtca 


aagggcgaaa 


aaccgtctat cagggcgatg 


gcccactacg 


8820 
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tgaaccatca cccaaatcaa gttttttggg gtcgaggtgc cgtaaagcac taaatcggaa 8880 
ccctaaaggg agcccccgat ttagagcttg acggggaaag ccggcgaacg tggcgagaaa 8940 
ggaagggaag aaagcgaaag gagcgggcgc cattcaggct gcgcaactgt tgggaagggc 9000 
gatcggtgcg ggcctcttcg ctattacgcc agctggcgaa agggggatgt gctgcaaggc 9060 
gattaagttg ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg acggccagtg 9120 
aattaattcc catcttgaaa gaaatatagt ttaaatattt attgataaaa taacaagtca 9180 
ggtattatag tccaagcaaa aacataaatt tattgatgca agtttaaatt cagaaatatt 9240 
tcaataactg attatatcag ctggtacatt gccgtagatg aaagactgag tgcgatatta 9300 
tgtgtaatac ataaattgat gatatagcta gcttagctca tcgggggatc cgtcgaagct 9360 
agcttgggtc ccgctcagaa gaactcgtca agaaggcgat agaaggcgat gcgctgcgaa 9420 
tcgggagcgg cgataccgta aagcacgagg aagcggtcag cccattcgcc gccaagctct 9480 
tcagcaatat cacgggtagc caacgctatg tcctgatagc ggtccgccac acccagccgg 9540 
ccacagtcga tgaatccaga aaagcggcca ttttccaCca tgatattcgg -caagcaggca 9600 
tcgccatggg tcacgacgag atcctcgccg tcgggcatgc gcgccttgag cctggcgaac 9660 
agttcggctg gcgcgagccc ctgatgctct tcgtccagat catcctgatc gacaagaccg 9720 
gcttccatcc gagtacgtgc tcgctcgatg cgatgtttcg cttggtggtc gaatgggcag 9780 
gtagccggat caagcgtatg cagccgccgc attgcatcag ccatgatgga tactttctcg 9840 
gcaggagcaa ggtgagatga caggagatcc tgccccggca cttcgcccaa tagcagccag 9900 
tcccttcccg cttcagtgac aacgtcgagc acagctgcgc aaggaacgcc cgtcgtggcc 9960 
agccacgata gccgcgctgc ctcgtcctgc agttcattca gggcaccgga caggtcggtc 10020. 
ttgacaaaaa gaaccgggcg cccctgcgct gaeagccgga acacggcggc atcagagcag 10080 
ccgattgtct gttgtgccca gtcatagccg aatagcctct ccacccaagc ggccggagaa 10140 
cctgcgtgca atccatcttg ttcaatccaa gctcccatgg gccctcgact agagtcgaga 10200 
tctggattga gagtgaatat gagactctaa ttggataccg aggggaattt " atggaacgtc 10260 
agtggagcat ttttgacaag aaatatttgc tagctgatag tgaccttagg cgacttttga 10320 
acgcgcaata atggtttctg acgtatgtgc ttagctcatt aaactccaga aacccgcggc 10380 
tgagtggctc cttcaacgtt gcggttctgt cagttccaaa cgtaaaacgg cttgtcccgc 10440 
gtcatcggcg ggggtcataa cgtgactccc ttaattctcc gctcatgatc ttgatcccct 10500 
gcgccatcag atccttggcg gcaagaaagc catccagttt actttgcagg gcttcccaac 10560 



^1 
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cttaccagag 


ggcgccccag 


ctggcaattc 


cggttcgctt 


gctgtccata 


aaaccgccca 


10620 


gtctagctat 


cgccatgtaa 


gcccactgca 


agctacctgc 


tttctctttg' 


cgcttgcgtt 


10680 


ttcccttgtc 


cagatagccc 


agtagctgac 


attcatccgg 


ggtcagcacc 


gtttctgcgg 


10740 


actggctttc 


tacgtgttcc 


gcttccttta 


gcagcccttg 


cgccctgagt 


gcttgcggca 


10800 


gcgtgaagct 


tgcatgcctg 


caggtcgacg 


gcgcgccgag 


ctcctcgagc 


aaatttacac 


10860 


attgccacta 


aacgtctaaa 


cccttgtaat 


ttgtttttgt 


tttactatgt 


gtgttatgta 


10920 


tttgatttgc 


gataaatttt 


tatatttggt 


actaaattta 


taacaccttt 


tatgctaacg 


10980 


tttgccaaca 


cttagcaatt 


tgcaagttga 


ttaattgatt 


ctaaattatt 


tttgtcttct 


11040 


aaatacatat 


actaatcaac 


tggaaatgta 


aatatttgct 


aatatttcta 


ctataggaga 


11100 


attaaagtga 


gtgaatatgg 


taccacaagg 


tttggagatt 


taattgttgc 


aatgctgcat 


11160 


ggatggcata 


tacaccaaac 


attcaataat 


tcttgaggat 


aataatggta 


ccacacaaga 


11220 


tttgaggtgc 


atgaacgtca 


cgtggacaaa 


aggtttagta 


atttttcaag 


acaacaatgt 


11280 


taccacacac 


aagttttgag 


gtgcatgcat 


ggatgccctg 


tggaaagttt 


aaaaatattt 


11340 


tggaaatgat 


ttgcatggaa 


gccatgtgta 


aaaccatgac 


atccacttgg 


aggatgcaat 


11400 


aatgaagaaa 


actacaaatt 


tacatgcaac 


tagttatgca 


tgtagtctat 


ataatgagga 


11460 


ttttgcaata 


ctttcattca 


tacacactca 


ctaagtttta 


cacgattata 


atttcttcat 


11520 


agccagccca 


ccgcggtgga 


aa atg gag 
Met Glu 
1 


gtc gtg gag aga ttc tac ggt gag 
Val Val Glu Arg Phe Tyr Gly Glu 
5 10 


11572 



ttg gat ggg aag gtc teg cag ggc gtg aat gca ttg ctg ggt agt ttt 11620 
Leu Asp Gly Lys Val Ser Gin Gly Val Asn Ala Leu Leu Gly Ser Phe 
15 20 25 

ggg gtg gag ttg acg gat acg ccc act acc aaa ggc ttg ccc etc gtt 11668 
Gly Val Glu Leu Thr Asp Thr Pro Thr Thr Lys Gly Leu Pro Leu Val 
30 35 40 

gac agt ccc aca ccc ate gtc etc ggt gtt tct gta tac ttg act att . 11716 
Asp Ser Pro Thr Pro lie Val Leu Gly Val Ser Val Tyr Leu Thr lie 
45 50 55 

gtc att gga ggg ctt ttg tgg ata aag gee agg gat ctg aaa ccg cge 11764 
Val lie Gly Gly Leu Leu Tip lie Lys Ala Arg Asp Leu Lys Pro Arg 
60 65 70 

gcc teg gag cca ttt ttg- etc caa get ttg gtg ctt gtg cac aac ctg 11812 
Ala Ser Glu Pro Phe Leu Leu Gin Ala Leu Val Leu Val His Asn Leu* 
75 80 85 • . 90 

ttc tgt ttt geg etc agt ctg tat atg tgc gtg ggc ate get tat cag 11860 



gtg gaa ttc atg gat acc gtt ate atg ata ctg aag cgc age acc agg 

Val Glu Phe Met Asp Thr Val lie Met lie Leu Lys Arg Ser Thr Arg 

140 145 150 

caa ata age ttc etc cac gtt tat cat cat tct tea att tec etc att 

Gin He Ser Phe Leu His Val Tyr His His Ser Ser He Ser Leu He 

155 160 165 ' 170 



11908 
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Phe Cys Phe Ala Leu Ser Leu Tyr Met Cys Val Gly lle Ala Tyr Gin 
95 100 105 

get att acc tgg egg tac tct etc tgg ggc aat gca tac aat ect aaa 
Ala He Thr Trp Arg Tyr Ser Leu Trp Gly Asn Ala Tyr Asn Pro Lys 
110 115 120 

cat aaa gag atg gcg att ctg gta tac ttg ttc tac atg tct aag tac 11956 
His Lys Glu Met Ala He Leu Val Tyr Leu Phe Tyr. Met Ser Lys Tyr 
. 125 130 135 



12004 



12052 



tgg tgg get att get cat cac get ect ggc ggt gaa gca tat tgg tct 12100 
Trp Trp Ala He Ala His His Ala Pro Gly Gly Glu Ala Tyr Trp Ser 
175 180 185 

gcg get ctg aac tea gga gtg cat gtt etc atg tat gcg tat tac ttc 12148 
Ala Ala Leu Asn Ser Gly Val His Val Leu Met Tyr Ala Tyr Tyr Phe 
190 195 200 

ttg get gcc tgc ett ega agt age eca aag tta aaa aat aag tac ctt 12196 
Leu Ala Ala Cys Leu Arg Ser Ser. Pro Lys Leu Lys Asn Lys Tyr Leu 
205 210 215 

ttt tgg ggc agg tac ttg aca caa ttc caa atg ttc cag ttt atg ctg 12244 
Phe Trp Gly Arg Tyr Leu Thr Gin Phe Gin Met Phe Gin Phe Met Leu 
220 225 230 

aac tta gtg cag get tac tac gac atg aaa aeg aat gcg eca tat cca 12292 
Asn Leu Val Gin Ala Tyr Tyr Asp Met Lys Thr Asn Ala Pro Tyr Pro 
235 . . 240 ■ 245 • 250 

caa tgg ctg ate aag att ttg ttc tac tac atg ate teg ttg ctg ttt 12340 
Gin Trp Leu He Lys He Leu Phe Tyr . Tyr Met He Ser Leu Leu Phe 
255 260 265 

ctt ttc ggc aat ttt tac gta. caa aaa tac ate aaa ccc tct gac gga 12388 
Leu Phe Gly Asn Phe Tyr Val Gin Lys Tyr He Lys Pro Ser Asp Gly 
270 275 280 

aag caa aag gga get aaa act gag tga tctagaaggc ctcctgcttt 12435 
Lys Gin Lys Gly Ala Lys Thr Glu 
285 290 

aatgagatat gcgagacgcc tatgatcgca tgatatttgc tttcaattct gttgtgcacg 12495 

ttgtaaaaaa cctgagcatg tgtagctcag atccttaccg ccggtttcgg ttcattctaa 12555 

tgaatatatc acccgttact atcgtatttt tatgaataat attctccgtt . caatttactg 12615 

attgtccgtc gagcaaattt acacattgec actaaaegtc taaacccttg taatttgttt 12675 
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ttgttttact 


atgtgtgtta 


tgtatttgat 


ttgcgataaa 


tttttatatt 


tggtactaaa 12735 


tttataacac 


cttttatgct 


aacgtttgcc 


aacacttagc 


aatttgcaag 


ttgattaatt 12795 


gattctaaat 


tatttttgtc 


ttctaaatac 


atatactaat 


caactggaaa 


tgtaaatatt 12855 


tgctaatatt 


tctactatag 


gagaattaaa 


gtgagtgaat 


atggtaccac 


aaggtttgga 12915 


gatttaattg 


ttgcaatgct 


gcatggatgg 


catatacacc 


aaacattcaa 


taattcttga 12975 


ggataataat 


ggtaccacac 


aagatttgag 


gtgcatgaac 


gtcacgtgga 


caaaaggttt 13035 


agtaattttt 


caagacaaca 


atgttaccac 


acacaagttt 


tgaggtgcat 


gcatggatgc 13095 


cctgtggaaa 


gtttaaaaat 


attttggaaa 


tgatttgcat 


ggaagccatg 


tgtaaaacca 13155 


tgacatccac 


ttggaggatg 


caataatgaa gaaaactaca 


aatttacatg 


caactagtta 13215 


tgcatgtagt 


ctatataatg 


aggattttgc 


aatactttca 


ttcatacaca 


ctcactaagt 13275 


tttacacgat 


tataatttct 


tcatagccag cggatcc atg gta ttc gcg ggc ggt 13330 



Met Val Phe Ala Gly Gly 
295 

gga ctt cag cag ggc tct ctc.gaa gaa aac ate gac gtc gag cac att 13378 
Gly Leu Gin Gin Gly Ser Leu Glu Glu Asn lie Asp Val Glu His lie 
300 305 310 

gcc agt atg tct etc ttc age gac ttc ttc agt tat gtg tct tea act 13426 
Ala Ser Met Ser Leu Phe Ser Asp Phe Phe Ser Tyr Val Ser Ser Thr 
315 320 ' 325 

gtt ggt teg tgg age gta cac agt ata caa cet ttg aag cgc ctg acg 13474 
Val Gly Ser Trp Ser Val His Ser lie Gin Pro Leu Lys Arg Leu Thr . 
330 ... 335. • 340 345 

.agt aag aag cgt gtt teg gaa age get gcc gtg caa tgt ata tea get 13522 
Ser Lys Lys Arg Val Ser Glu Ser Ala Ala Val Gin Cys lie Ser Ala 
350 355 , 360 • 

gaa gtt cag aga aat teg agt ace cag gga act gcg gag gca etc gea 13570 
Glu Val Gin Arg Asn Ser Ser Thr Gin Gly Thr Ala Glu Ala Leu Ala 

365 370 r *; 375 . 

gaa tea gtc gtg aag cec acg aga cga agg tea tct cag tgg aag aag 13618 
Glu Ser Val Val Lys Pro Thr. Arg Arg Arg Ser Ser Gin Trp Lys Lys 
380 385 390 

teg aca cac cec eta tea gaa gta gca gta cac aac aag cca age gat 13666 
Ser Thr His Pro Leu Ser Glu Val Ala Val His Asn Lys Pro Ser Asp 
395 400 405 

tgc tgg att gtt gta aaa aac aag gtg tat gat gtt tec aat ttt gcg 13714 
Cys Trp lie Val Val Lys Asn Lys Val Tyr Asp Val Ser Asn Phe Ala 
410 415 420 425 ' 



gac gag eat ecc gga gga tea gtt att agt act tat ttt gga cga gac 



13762 
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Asp Glu His Pro Gly Gly Ser Val He Ser Thr Tyr Phe Gly Arg Asp 
430 435 440 

ggc aca gat gtt ttc tct agt ttt cat gca get tct aca tgg aaa att 13810 
Gly Thr Asp Val Phe Ser Ser Phe His Ala Ala Ser Thr Trp Lys He 
' 445 450 455 

; j 

ctt caa gac ttt tac att .ggt gac gtg gag agg gtg gag ccg act cca 13858 
Leu Gin Asp Phe Tyr He Gly Asp Val Glu Arg Val Glu Pro Thr Pro 
460 465 470 

gag ctg ctg aaa gat ttc cga gaa atg aga get ctt ttc ctg agg gag 13906 
Glu Leu Leu Lys Asp Phe Arg Glu Met Arg Ala Leu Phe Leu Arg Glu 
475 . 480' 485 

caa ctt ttc aaa agt teg aaa ttg tac tat gtt atg aag ctg etc aeg 13954 
Gin Leu Phe Lys Ser Ser. Lys Leu Tyr Tyr Val Met Lys Leu Leu Thr 
490 495 500 . 505 • 

aat gtt get att ttt get gcg age att gca ata ata tgt tgg age aag 14002 
Asn Val Ala He Phe Ala Ala Ser He Ala He He Cys Trp Ser Lys 
510 515 • ' 520 

act att tea gcg gtt ttg get tea get tgt atg atg get ctg tgt ttc 14050 
. Thr He Ser Ala Val Leu Ala Ser Ala Cys Met Met Ala Leu Cys Phe 
525 '530 535 

caa cag tgc gga tgg eta tec cat gat ttt etc cae aat cag gtg ttt 14098 
Gin Gin Cys Gly Trp Leu Ser His Asp Phe Leu His Asn Gin Val Phe 
540 545 550 

gag aca cgc tgg ctt aat gaa gtt gtc ggg tat gtg ate ggc aac gee 14146 
Glu Thr Arg Trp Leu Asn Glu Val Val Gly Tyr Val He Gly Asn Ala 

555 560 565 * ■ 

gtt ctg ggg ttt agt aca ggg tgg tgg aag gag aag eat aac ctt eat 14194 
Val Leu Gly Phe Ser Thr - Gly Trp Trp Lys Glu Lys His Asn Leu His 
570 575 .: • \ 58b 585 

cat get get' cca aat gaa" tgc gat cag act tac caa cca att gat gaa 14242 
His Ala Ala Pro Asn Glu Cys Asp Gin Thr Tyr Gin Pro He Asp Glu 
590 595 600 

gat att gat act etc ecc etc att gee tgg age aag gac ata ctg gee 14290 
Asp He Asp Thr Leu Pro Leu He Ala Tzp Ser Lys Asp He Leu Ala 
605 610 '615 

aca gtt gag aat aag aca ttc ttg cga ate etc caa tac cag cat ctg 14338 
Thr Val Glu Asn Lys Thr Phe Leu Arg He Leu Gin Tyr Gin His Leu 
620 625 ' 630 

ttc ttc atg ggt ctg tta ttt ttc gee egt ggt agt .tgg etc ttt tgg 14386 
Phe Phe Met Gly Leu Leu Phe Phe Ala Arg Gly Ser Trp Leu Phe Trp ■ 
635 -640 645 ' 

i. J 

age tgg aga tat acc tct aca gca gtg etc tea cct gtc gac agg ttg 14434 
Ser Trp Arg Tyr Thr Ser Thr Ala Val Leu Ser Pro Val Asp Arg Leu 
650 655 660 665 
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ttg gag aag gga act gtt ctg ttt cac tac ttt tgg ttc gtc ggg aca 14482 
Leu Glu Lys Gly Thr Val Leu Phe His Tyr Phe Trp Phe Val Gly Thr 
670 675 680 

gcg tgc tat ctt etc cct ggt tgg aag cca tta gta tgg atg gcg gtg 14530 
Ala Cys Tyr Leu Leu Pro Gly Trp Lys Pro Leu Val Trp Met Ala Val 
685 690 695 

act gag etc atg tec ggc atg ctg ctg ggc ttt gta ttt gta ctt age 14578 
Thr Glu Leu Met Ser Gly Met Leu Leu Gly Phe Val Phe Val Leu Ser 
700 .705 .710 

; i 

cac aat ggg atg gag gtt tat aat teg tct aaa gaa ttc gtg agt gca 14626 
His Asn Gly Met Glu Val Tyr Asn Ser Ser Lys Glu Phe Val Ser Ala 
715- 720 725 

cag ate gta tec aca egg gat ate. aaa gga aac ata ttc aac gac tgg 14674 
Gin lie Val Ser Thr Arg Asp lie Lys Gly Asn lie Phe Asn Asp Trp 
730 735 ' 740 " 745 

ttc act ggt ggc ctt aacagg caa ata gag cat cat ctt ttc cca aca 14722 
' Phe Thr Gly Gly Leu Asn Arg Gin lie Glu His His Leu Phe Pro Thr 
750 755 760 

atg ecc agg eat aat tta aac aaa ata gca cct aga gtg gag gtg ttc 14770 
Met Pro Arg His Asn Leu Asn Lys lie Ala Pro Arg Val Glu Val Phe 
765 770 775 

tgt aag aaa cac ggt ctg gtg tac gaa gac gta^tct att gtt acc ggc 14818 
Cys Lys Lys His Gly Leu Val Tyr Glu Asp Val Ser lie Ala Thr Gly 
780 785 * 790 

act tgc aag gtt ttg aaa gca ttg. aag gaa gtc gcg gag get gcg gca 14866 
Thr Cys Lys Val Leu Lys Ala Leu Lys Glu Val Ala Glu Ala Ala Ala 
795 800 805 

gag cag cat get acc acc agt taa gctagcgtta accctgcttt aatgagat'at 14920 
Glu Gin His Ala Thr Thr Ser 
810 815 



gcgagacgcc 


tatgatcgca 


tgatatttgc tttcaattct 


gttghgeacg 


ttgtaaaaaa 


14980 


cc'tgagcatg 


tgtagctcag 


atecttaccg ccggtttcgg 


ttcattctaa 


tgaatatatc 


15040 


acccgttact 


atcgtatttt 


tatgaataat attctccgtt 


caatttactg 


attgtccgtc 


15100 


gaegaattcg 


agcteggege 


gcetctagag gatcgatgaa 


ttcagategg 


ctgagtgget 


15160 


ccttcaacgt 


tgcggttctg 


tcagttccaa acgtaaaacg 


gcttgtcccg 


cgtcatcggc 


15220 


srggggtcata 


acgtgactcc 


cttaattctc cgctcatgat 


cagattgtcg 


tttcccgcct 


15280 


tcagtttaaa 


ctatcagtgt 


ttgacaggat atattggcgg 


gtaaacctaa. 


gagaaaagag 


15340 


cgtttattag 


aataatcgga 


tatttaaaag ggcgtgaaaa 


ggtttatcct 


tcgtccattt 


15400 


gtatgtgcat 


gccaaccaca 


gggttcccca 






15430 
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<210> 26 
<211> 290 
<212> PRT 

<213> Unknown • . 
<400> 26 

Met Glu Val Val Glu Arg Phe Tyr Gly Glu Leu Asp Gly Lys Val Ser 
15 10 15 

Gin Gly Val Asn Ala Leu Leu Gly Ser Phe Gly Val Glu Leu Thr Asp 
20 . 25 30 

Thr Pro Thr Thr Lys Gly Leu Pro Leu Val Asp Ser Pro Thr Pro Ile 
35 . 40 . 45 

Val Leu Gly Val Ser Val Tyr Leu Thr Ile Val Ile Gly Giy Leu Leu 

50 ■ 5 5 ' . 60 • 

Trp Ile Lys Ala Arg Asp Leu Lys .Pro Arg Ala Ser Glu Pro Phe Leu 
65 70 . 75 80 

Leu Gin Ala Leu Val Leu Val His Asn Leu Phe Cys Phe Ala Leu Ser 
85 90 95 

Leu Tyr Met Cys Val Gly He Ala Tyr Gin Ala lie Thr Trp Arg Tyr 
100 105 110 

Ser Leu Trp Gly Asn Ala Tyr Asn Pro Lys His Lys Glu Met Ala Ile 
115 120 125 

Leu Val Tyr Leu Phe Tyr Met Ser Lys Tyr Val Glu Phe Met Asp Thr 
130 13-5 140 

Val lie Met Ile Leu Lys Arg Ser Thr Arg Gin lie Ser Phe Leu His 
145 150 155 ' 160 

Val Tyr His His Ser Ser He- Ser Leu lie Trp Trp Ala He Ala His 
165 170 175 

His Ala Pro Gly Gly Glu Ala Tyr Trp Ser Ala Ala Leu Asn Ser Gly 
180 185 190 

Val His Val Leu Met Tyr Ala Tyr Tyr Phe Leu Ala Ala Cys Leu Arg 
195 200 205 

Ser Ser Pro Lys Leu Lys Asn Lys Tyr Leu Phe Trp Gly Arg Tyr Leu 
210 215 220 

Thr Gin Phe Gin Met Phe Gin Phe Met Leu Asn Leu Val Gin Ala Tyr 
225 230 235 240 

Tyr Asp Met Lys Thr Asn Ala Pro Tyr Pro Gin Trp Leu lie Lys lie 
245 250 255 

Leu Phe Tyr Tyr Met Ile Ser Leu Leu Phe Leu Phe Gly Asn. Phe Tyr 
260 265 270 
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Val Gin Lys Tyr lie Lys Pro Ser Asp Gly Lys Gin Lys Gly Ala Lys 
275 280 285 

Thr Glu 
290 



<210> 27 
<211> 525 
<212> PRT 
<213> Unknown 

<400> 27 

Met Val Phe Ala Gly Gly Gly Leu Gin Gin Gly Ser Leu Glu Glu Asn 
15. 10 • 15 

He Asp Val Glu His lie Ala Ser Met Ser Leu Phe Ser 2^p Phe Phe 
. ' 20 ' ' 25 30 

Ser Tyr Val Ser Ser Thr Val Gly Ser Trp Ser Val His Ser He Gin 
35 .40 45 

Pro Leu Lys Arg Leu Thr Ser. Lys Lys Arg Val Ser Glu Set Ala Ala 
.50 • 55 60 

Val Gin Cys He Ser Ala Glu Val Gin Arg Asn Ser Ser Thr Gin Gly 
65 70 75 80 

Thr Ala Glu Ala Leu Ala Glu Ser Val Val Lys Pro Thr Arg Arg Arg 
85 90 . 95 

Ser Ser Gin Trp Lys Lys Ser Thr His Pro Leu Ser Glu Val Ala Val 
100 105 110 

His Asn Lys Pro Ser Asp Cys Trp He Val Val Lys Asn, Lys Val Tyr- 
115 , 120 125 

Asp Val Ser Asn Phe Ala -Asp Glu" His Pro Gly Gly Ser Val He Ser ' 
130 135 140 

Thr Tyr Phe Gly Arg Asp Gly Thr Asp Val Phe Ser Ser Phe His Ala 
■ 145 . 150 155 ' 160 

Ala Ser Thr Trp Lys He Leu Gin Asp Phe Tyr He Gly Asp Val Glu 
165 170 175 

Arg Val Glu Pro Thr Pro Glu Leu Leu Lys Asp Phe Arg Glu Met Arg 
180 185' 190 

Ala Leu Phe Leu Arg Glu Gin Leu Phe Lys Ser Ser Lys Leu Tyr Tyr 
195 200 205 

Val Met Lys Leu Leu Thr Asn Val Ala He Phe Ala Ala Ser He Ala 
210 215 220 

He He Cys Trp Ser Lys Thr He Ser Ala Val Leu Ala Ser Ala Cys 
225 230 235 240 
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Met Met Ala Leu Cys Phe Gin Gin Cys Gly Trp Leu Ser His Asp Phe 
245 250 255 

Leu His Asn Gin Val Phe Glu Thr Arg Trp Leu Asn ,Glu Val Val Gly 
260 265 . 270 

Tyr val lie Gly Asn Ala Val Leu Gly Phe Ser Thr Gly Trp Trp Lys 
275 280 285 

Glu Lys His Asn Leu His His Ala Ala Pro Asn Glu Cys Asp Gin Thr 
290 295 300 

Tyr Gin Pro He Asp Glu Asp He Asp Thr Leu Pro Leu lie Ala Trp 
305 310 315 320 

Ser Lys Asp He Leu. Ala Thr Val Glu Asn Lys Thr Phe Leu Arg He 
325. 330 335 

Leu Gin Tyr Gin His Leu Phe Phe Met Gly Leu Leu Phe Phe Ala Arg . 
340 345 350 

Gly Ser Trp Leu Phe^Typ Ser Trp Arg Tyr 1?hr Ser Thr Ala Val Leu 
. 355 360 365 

Ser Pro Val Asp Arg Leu Leu Glu Lys Gly Thr Val Leu Phe His Tyr 
370 375. 380 

Phe Trp Phe Val Gly Thr Ala Cys Tyr Leu Leu Pro Gly Trp Lys Pro 
385 390 395 *. 400 

Leu Val Trp Met Ala Val Thr Glu Leu Met Ser Gly Met Leu Leu Gly 
405 410 415 

Phe Val Phe Val Leu Ser His Asn Gly Met Glu Val Tyr Asn Ser Ser 
420 425 . ' 430 • 

Lys Glu Phe Val Ser Ala Gin He" Val Ser Thr Arg Asp He Lys Gly 
435 440 445 

Asn He Phe Asn Asp Trp Phe Thr Gly Gly Leu Asn Arg Gin He Glu 
450 455 460 

His His Leu Phe Pro Thr Met Pro Arg His Asn Leu Asn Lys He Ala 
465 470 475 480 

Pro Arg Val Glu Val Phe Cys Lys Lys His Gly Leu Val Tyr Glu Asp 
485 490 495 

Val Ser He Ala Thr Gly Thr Cys Lys Val Leu Lys Ala Leu Lys Glu 
500 . - 505 510,., 

Val Ala Glu Ala Ala Ala Glu Gin His Ala Thr Thr Ser 
515 ■ 520 525 



<210> 28 
<211> 17752 
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<212> DNA 
<213> Unlaiown 

<220> 

<223> pflanz. Expressionsvektor loit 3 

Promotor-Terminator- Expressionskassetten 
inseriert mit Physcomitrella Elongase + Desaturase 
+ Phaeodactylxam Desaturase 

<220> 
<221> CDS 

<222> (11543). • (12415) 

<220> 
<221> CDS 

<222> -(13313) . . (14890) 

<220> 
<221> CDS 

<222> (15791) (17200) 
<400> 28 



gatctggcgc 


cggccagcga 


gacgagcaag attggccgcc 


gcccgaaacg 


atccgacagc 


60 


gcgcccagca 


caggtgcgca 


ggcaaattgc accaacgcat 


acagcgccag 


cagaatgcca 


120 


tagtgggcgg 


tgacgtcgtt 


cgagtgaacc agatcgcgca 


gsraggcccgg 


cagcaccggc 


180 


ataatcaggc 


cgsitgccgac 


agcgtcgagc . gcgacagtgc 


tcagaattac 


gatcaggggt 


240 


atgttgggtt 


tcacgtctgg 


cctccggacc 


agcctccgct 


ggtccgattg 


aacgcgcgga 


300 


ttctttatca 


ctgataagtt 


ggtggacata 


ttatgtttat 


cagtgataaa 


gtgtcaagca 


360 


tgacaaagtt 


gcagccgaat 


acagtgatcc 


gtgccgccct 


ggacctgttg 


aacgaggtcg 


420 


gcgtagacgg 


tctgacgaca 


cgcaaactgg 


cggaacggtt- 


gggggttcag 


Gagccggcgc 


480 


tttactggca 


cttcaggaac 


aagcgggcgc 


tgctcgacgc 


actggccgaa 


gccatgctgg 


540 


cggagaatca 


tacgcattcg 


gtgccgagag 


ccgacgacga 


ctggcgctca 


tttctgatcg 


600 


ggaatgcccg 


cagcttcagg 


caggcgctgc 


tcgcctaccg 


cgatggcgcg 


cgcatccatg 


660 


ccggcacgcg 


accgggcgca 


ccgcagatgg 


aaacggccga 


cgcgcagctt 


cgcttcctct 


720.. 


gcgaggcggg 


tttttcggcc 


ggggeicgccg 


tcaatgcgct 


gatgacaatc 


agctacttca 


780 


ctgttggggc 


cgftgcttgag 


gagcaggccg 


gcgacagcga 


tgccggcgag 


cgcggcggca 


840 


ccgttgaaca 


ggctccgctc 


tcgccgctgt 


tgcgggccgc 


gatagacgcc 


ttcgacgaag 


900 


ccggtccgga 


cgcagcgttc 


gagcagggac 


tcgcggtgat 


tgtcgatgga 


ttggcgaaaa 


960 


ggaggctcgt 


tgtcaggaiac 


gttgaaggac 


cgagaaaggg 


tgacgattga 


tcaggaccgc 


1020 


tgccggagcg 


caacccactc 


actacagcag 


agccatgtag 


acaacatccc 


ctcccccttt 


1080 



ccaccgcgtc agacgcccgt agcagcccgc 
ccaagcctca cggccgcgct cggcctctct 
gctcactgac tcgctgcgct cgqtcgttcg 
ggcggtaata cggttatcca cagaatcagg 
aggccagcaa' aaggccagga accgtaaaaa 
ccgcccccct gacgagcatc acaaaaatcg 
aggactataa agataccagg cgtttccccc 
gaccctgccg cttaccggat acctgtccgc 
ccgctgcata accctgcttc ggggtcatta 
tcgcacgata tacaggattt tgccaaaggg 
ggcgtcagcc gggcaggata ggtgaagtag 
ctgtccctta ttcgcacctg gcggtgctca 
ctaccgccgg cgtaacagat gagggcaagc 
agggcagccc acctatcaag gtgtactgcc 
aggcggcggc ggccggcatg agcctgtcgg 
aaatcacggg.cgtcgtiggac tatgagcacg 
tgggccgcct gggcggcctg ctgaaactct 
tcggtgatgc .cacgatcctc gccctgctgg 
gcaaggtcat gatgggcgtg gtccgcccga 
aacggccggg gggtgcgcgt gattgccaag 
gacttcgcgg agctggtgaa gtacatcacc 
gacgctcacc gggctggttg ccctcgccgc 
cgcgccagaa acgccgtcga agccgtgtgc 
cctcgcggaa aacttggccc tcactgacag 
cgactcaccc ggcgcggcgt tgacagatga 
gagctggcca gcctcgcaaa tcggcgaaaa 
gatgtggaca agcctgggga taagtgccct 
tgacagatga ggggcgcgat ccttgacact 
gcacctattg acatttgagg ggctgtccac 
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tacaacrcttt ttcatcrccct 


gccctagcgt 


1140 


aCTCQTcrccttc tacrccrctctt 


ccgcttcctc 


1200 


ac tacaaccra cccratatcag 


ctcactcaaa 


1260 


ggataacgca ggaaagaaca 


tgtgagcaaa 


1320 


ggccgcgttg ctggcgtttt 


tccataggct 


1380 


acgctcaagt cagaggtggc 


gaaacccgac 


1440 


tggaagctcc ctcgtgcgct 


ctcctgttcc 


1500 


ctttctccct tcacraaacrccr 


tggcgctttt 


1560 


tagcgatttt ttcggtatat 


ccatcctttt 


1620 


ttcgtgtaga ctttccttgg 


tgtatccaac 


1680 


acccaccccrc craGCGcrcrtcrt 


tccttcttca 


1740 


acoraaaatcc terete tcrcGra 


ggctggccgg 


1800 


aaataactaa tcraaaccaacr 


ccaaccagga 


1860 


ttccagacga acgaagagcg 


attgaggaaa 


1920 


cctacctgct ggccgtcggc 


cagggctaca 


1980 


tccgcgagct ggcccgcatc 


aatggcgacc 


2040 


ggctcaccga cgacccgcgc 


acggcgcggt 


2100 


caaaaafccaa acracraaGcacr 


gacgagcttg 


2160 


crcrcrcacracrc c atcrati 1 1 1 1 1 


tagccgctaa 


2220 




G aaoaacacrc 


2280 


rr^^nrraOT'aaa' crcaacracccra 


gcgc c 1 1 1 gc 


2340 


trrfrcrctcrcrecf crcccrtctatcr 
i»y y y ^ i»y y v#y y\i»s#y vv*v»y 


crcc c t CTC aaa 


2400 


y o^y w v*y w y y^i*wy ^irfwyy V* 


crttCTto0ata 

^3 W W33 wvj 53 


2460 


atrrarrrrrrrrnrf craf crttcraca 
a^yayyyy^y y«v*y fc»y w*v,»» 


c 1 1 aacQCTcrc 

%^ w ^53 ^^3j 53 53 53 ^* 


2520 


yyyy\«CLyyww ^yaiaU ws»yyv# 


ecrcrccraccrtcr 


2580 


cgcctgattt* tacgcgagtt 


tcccacagat 


2640 


gcggtattga cacttgaggg 


gcgcgactac 


2700 


tgaggggcag agtgctgaca 


gatgaggggc 


2760 


aggcagaaaa tccagcattt 


gcaagggttt 


2820 
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ccgcccgttt ttcggccacc gctaacctgt cttttaacct gcttttaaac caatatttat 2880 
aaaccttgtt tttaaccagg gctgcgccct gtgcgcgtga ccgcgcacgc cgaagggggg 2940 
tgccccccct tctcgaaccc tcccggcccg ctaacgcggg cctcccatcc ccccaggggc 3000 
tgcgcccctc ggccgcgaac ggcctcaccc caaaaatggc agcgctggca gtccttgcca 3060 
ttgccgggat cggggcagta acgggatggg cgatcagccc gagcgcgacg cccggaagca 3120 
ttgacgtgcc gcaggtgctg .gcatcgacat tcagcgacca ggtgccgggc agtgagggcg 3180 
gcggcctggg tggcggcctg cccttcactt cggccgtcgg ggcattcacg gacttcatgg 3240 
cggggccggc aatttttacc ttgggcattc ttggcatagt ggtcgcgggt gccgtgctcg 3300 
tgttcggggg tgcgataaac ccagcgaacc atttgaggtg ataggtaaga ttataccgag 3360. 
gtatgaaaac gagaattgga, cetttacaga attactctat -gaagcgccat atttaaaaag 3420 
ctaccaagac gaagaggatg aagaggatga ggaggcagat tgccttgaat atattgacaa 3480 
tactgataag ataatatatc ttttatatag aagatatcgc cgtatgtaag gatttcaggg 3540 
ggcaaggcat aggcagcgcg cttatcaata tatctataga atgggcaaag cataaaaact 3600 
tgcatggact aatgcttgaa acccaggaca ataaccttat agcttgtaaa ttctatcata 3660 
attgggtaat gactccaact tattgatagt gttttatgtt cagataatgc ccgatgactt 3720 
tgtcatgcag ctccaccgat tttgagaacg acagcgactt ccgtcccagc cgtgccaggt 3780 
gctgcctcag attcaggtta tgccgctcaa ttcgctgcgt atatcgcttg ctgattacgt 3840 
gcagctttcc cttcaggcgg gattcataca gcggccagcc atccgtcatc catatcacca 3900 
cgtcaaaggg tgacagcagg ctcataagac gccccagcgt cgccatagtg cgttcaccga 3960 
atacgtgcgc aacaaccgtc ttccggagac tgtcatacgc gtaaaacagc cagcgctggc 4020 
gcgatttagc cccgacatag ccccactgtt cgtccatttc cgcgcagacg atgacgtcac 4080 
tgcccggctg tatgcgcgag gttaccgact gcggcctgag ttttttaagt gacgtaaaat 4140 
cgtgttgagg ccaacgccca taatgcgggc tgttgcccgg catccaacgc cattcatggc 4200 
catatcaatg attttctggt gcgtaccggg ttgagaagcg gtgtaagtga actgcagttg 4260 
ccatgtttta cggcagtgag agcagagata gcgctgatgt ccggcggtgc ttttgccgtt 4320 
acgcaccacc ccgtcagtag ctgaacagga gggacagctg atagacacag aagccactgg 4380 
agcacctcaa aaacaccatc atacactaaa tcagtaagtt ggcagcatca cccataattg 4440 
tggtttcaaa atcggctccg tcgatactat gttatacgcc aactttgaaa acaactttga 4500 
aaaagctgtt ttctggtatt taaggtttta gaatgcaagg aacagtgaat tggagttcgt 4560 
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^ ^ 4" a ^ a 9 


cuagcuuCuu 


gggg^aucuu 


4- a a a a ^ry ♦* 
CdddUdV' wy U 


A rra a a a rra rr£r 
dy ddddy dy y 


a a Grrraaa aa 


4620 


a s a yi'/*T/^ +* a 

ua.a.cL C uo. 


a 9 s ^ 9 ^P9 9 4" 

aaacgagaa ^ 


duwdCC^yydd 


^ t* rra a a a a a p 
u uy ddddddu. 


t* rra "h r* rra a a a 
uy d ^wy dcaaw 


a t" ac cere t" err* 

a WMWwy w wy w 


4580 


a A 9 ^ A 


Cy y cLciy y act u 


y w uyw L> 


a a rtrrl" a i" a a 
ddyy cdi-du>d 


a ne* t" rrrrt" acta 
dy s«wy y ipvyyy 


arraaaatcraa 

cty wtCfcCiCfc w^uc* 


4740 


990r»^J*t**4't"^ 


f-9 9 9 99 f-/Yac 


y y d\.>dy Vi» ^y y 


i«Gii Vvdddy y y ^ 


ccacc tat era 

WWQbWW ^bbw^^tA 


tcrtiCTcraaccrcr 


4800 


rra ^ A a nrra <^ 
y dCLcLciy y dv^ct 


t" rra ^ rrf^ t* a t" CT 
i*y di^y v« u«CLVi«y 


err* t" rrrraaorrra 

y i*y y OLuy y a 


aa.crctcfcctcr 

CLGLy w V«%i« 


ttccaaaacrt 


cctacactitt 

W\J ^^^^^^ W W 


4860 


y ci AC y y c a u y 


cLuyy c uyy dy 


wddu^ v»y ^ L>w 


a Y era rrt^ era ncr 
dL«ydy wy dyy 


^wyciwyy w^ w 


cctttcfchccr 

WW W W \^V^ ^ W W^J 


4920 


ydayaCf uaCy 


aay d ugaacd 


a a ^ ^ Ora A 

dayCCCuyad 


ddydu udUwy 


dy wuy uduy w 


rf rra rr^ rr c a t" f 
yydy uy wduw 


4980 




ac c c ca ccga 


cacaucggac 


tgUCCwUdUd 


Cy ddUdgw uU 


dy dwdy w^y w 




ttagccgaat 


cggaucaccu 


accgaauaac 


gaucuggccg 


a ugugga t ty 


, Cy dddd w i'y y 


on 


gaagaagraca 


W <^ 4^ 4" ^ ^ A 

ccccacucaa 


agatccgcgc 


gagccguacg 


94-4*t-4*4'4'aaa 

acbuuccaaa 


gdcggcLdddy 


R 1 ^rn 

3x ou 

1 


c c Cy aay ay y 


aac u eg uc u u 


eccccacggc 


y d w c u y y y dy 


A A rrro a a ^a t" 
d Wdy ^ dd wd U 


r* ^ t* 1" irt" rra aa 
c u i«y uy ddd 


5220 


yauygcaaay 


i»aay cggc u u 




yyydyddy wy 


y wdy^y wyya 


wddy uy y w€» w 


5280 


yacauCyCCu 


CCuyCyCCCy 


/v4" /^ora 4* ^ a /*r^ 

gu cy d t*c cly y 


yd9yduduv«g 


rrrrrra a rra a r*a 
y^ydciyddv^d 


y i<»dwy wwy dy 


5340 


a 1- ^ ^ ^-rr 


dC c UdC uy y y 


yduUddycwu 


y d u uy y y dy d 


aaataaaat'a 

ddd WCLddd wd 


W V»Cw WGL WWW WO> 


5400 


c cggacgaac 


ugc u ucagca 


cccagaugcg 


/v/^^^a 9^^a 4" 

gcgcaacgd^ 


yCwygwydwd 


dy Cdyy djy wy 




cacc y ac u cc 


4* 4" ^ ^ a 4" ^ a 


dy uy uuuuyy 


tCdyy WW 


ydy y wi.*wdwy 


y wddy wd^ia* w 


5520 


gggcaagggg 


4*/^^/^ 4»/y^H a 

ccgc cggua u 


c eg ugcaggg 


^a a ^a 4* Yt^fXct 

wddy d u (-wyg 


A A t"Ar*^A A/Yt* 
ddwdWwddy L> 


d wy dy ocLy y d 


5580 


cggccagacg 


gtctacggga 


ccgaccucac 


cgccga caag 


/V net 9 4* 4" 9 4~ 

gcggaucacc 


Cyy dwdwwdd 




ggcaccaggc 


gggtcaaatic 


aggaateagg 


gcacatstgcc 


ccggcgcgag 


ccgggg caa u 


Z7 /UU 


cccgcaagga 


gggtgaatga 


atcggacgtt: 


tgaccggaag 


gcacacaggc 


aagaac uga u 


3 / OU 


cgacgcgggg 


Cuucccgccg 


agga tgc cga 


aaccducgca 


agccgcaccg 


Cwd^y wyuy w . 




gccccgcgaa 


acctitccagt 


ccgtcggctc 


gauggcccag 


cadgccdcgg 


CwcLdy duwy d 


c^flflr) 


gcgcgacagc 


gtgcaactgg 


Cucccccugc 


cccgcccgcg 


ccdccggccg 


Cwgc>gydycy 




ttcgcgtcgt 


ctcgaacagg 


aggcggcagg 


cccggcgaag 


ucgaiigacca 


ccgacacgcg 


ouuu 


aggaactatg 


acgaccaaga 


agcgaaaaac 


cgccggcgag 


gacctggcaa 


aac agg ucag 


ouou 


cgaggccaag 


caggccgcgt 


tgctgaaaca 


cacgaagcag 


cagatcaagg 


aaatgcagct 


6120 


ttccttgttc 


gatattgcgc 


cgtggccgga 


cacgatgcga 


gcgatgccaa 


acgacacggc 


6180 


ccgctctgcc 


ctgttcaccsL 


cgcgcaacaa 


gaaaatcccg 


cgcgaggcgc 


tgcaaaacaa 


6240 


ggtcattttc 


cacgtcaaca 


aggacgtgaa 


gatcacctac 


accggcgtcg 


agctgcgggc 


6300 
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cgacgatgac gaactggtgt ggcagcaggt gttggagtac gcgaagcgca cccctatcgg 6360 
cgagccgatc accttcacgt tctacgagct ttgccaggac ctgggctggt cgatcaatgg 6420 
ccggtattac acgaaggccg aggaatgcct gtcgcgccta caggcgacgg cgatgggctt 6480 
cacgtccgac cgcgttgggc acctggaatc ggtgtcgctg ctgcaccgct tccgcgtcct 6540 
ggaccgtggc aagaaaacgt cccgttgcca ggtcctgatc gacgaggaaa tcgtcgtgct 6600 
gtttgctggc gaccactaca cgaaattcat atgggagaag taccgcaagc tgtcgccgac 6660 
ggcccgaegg atgttcgact atttcagctc gcaccgggag ccgtacccgc tcaagctgga 6720 
aaccttccgc ctcatgtgcg gatcggattc cacccgcgtg aagaagtggc gcgagcaggt '6780 
cggcgaagcc tgcgaagagt tgcgaggcag cggcctggtg gaacacgcct gggtcaatga 6840 
tgacctggtg cattgcaaac gctagggcct tgtggggtca gttccggctg ggggttcagc 6900 
agccagcgct ttactggcat ttcaggaaca agcgggcact gctcgacgca cttgpttcgc 6960 
tcagtatcgc tcgggacgca cggcgcgctc tacgaactgc cgataaacag aggattaaaa 7a20 
ttgacaattg tgattaaggc tcagattcga cggcttggag cggccgacgt gcaggatttc 7080 
cgcgagatcc gattgtcggc cctgaagaaa gctccagaga tgttcgggtc cgtttacgag 7140 
cacgaggaga aaaagcccat ggaggcgttc gctgaacggt tgcgagatgc cgtggcattc 7200 
ggcgcctaca tcgacggcga gatcattggg ctgtcggtct tcaaacagga ggacggcccc 7260 
aaggacgctc acaaggcgca tctgtccggo gttttcgtgg agcccgaaca gcgaggccga 7320 
ggggtcgccg gtatgctgct gcgggcgttg ccggcgggtt* tattgctcgt gatgatcgtc 7380 
cgacagattc caacgggaat ctggtggatg cgcatcttca tcctcggcgc acttaatatt 7440 
tcgctattct - ergagcttgtt gtttatttcg gtctaccgcc tgccgggcgg ggtcgcggcg 7500 
acggtaggcg ctgtgcagcc gctgatggtc gtgttcatct ctgccgctct gctaggtagc 7560 
ccgatacgat tgatggcggt cctgggggct atttgcggaa ctgcgggcgt ggcgctgttg 7620 
gtgttgacac caaacgcagc gctagatcct gtcggcgtcg cagcgggcct ggcgggggcg 7680 
gtttccatgg cgttcggaac cgtgctgacc cgcaagtggc aacctcccgt gcctctgctc 7740 
acctttaccg cctggcaact ggcggccgga ggacttctgc tcgttccagt agctttagtg 7800 
tttgatccgc caatcccgat gcctacagga accaatgttc tcggcctggc gtggctcggc 7860 
ctgatcggag cgggtttaac ctacttcctt tggttccggg ggatctcgcg actcgaacct 7920 
acagttgttt ccttactggg ctttctcagc cccagatctg gggtcgatca gccggggatg 7980 
catcaggccg acagtcggaa cttcgggtcc ccgacctgta ccattcggtg agcaatggat 8040 



aggggagttg atatcgtcaa cgttcacttc 
cggctttatc cagcgatttc ctattatcrtc 
cggttaagcg agaaatgaat aagaaggctg 
tttgatcaca ggcagcaacg ctctgtcatc 
tcatccgtgt ttcaaacccg gcagcttagt 
gagcaaagtc tgccgcctta caacggctct 
gcctgtatcg agtggtgatt ttgtgccgag 
tggcaggata tattgtggtg taaacaaatt 
gacgttttta atgtactggg gtggtttttc 
tgcccttcac cgcctggccc tgagagagtt 
gcaggcgaaa atcctgtttg atggtggttc 
agaatagccc gagatagggt tgagtgttgt 
gaacgtggac tccaacgtca aagggcgaaa 
tgaaccatca cccaaatcaa gttttttggg 
ccctaaaggg agcccccgat ttagagcttg 
ggaagggaag aaagcgaaag gagcgggcgc 
gatcggtgcg ggcctcttcg ctattacgcc 
gattaagttg ggtaacgcca gggttttccc 
aattaattcc catcttgaaa gaaatatagt 
ggtattatag tccaagcaaa aacataaatt 
tcaataactg attatatcag ctggtacatt 
tgtgtaatac ataaattgat gatatagcta 
agcttgggtc ccgctcagaa gaactcgtca 
tcgggagcgg cgataccgta aagcacgagg 
tcagcaatat cacgggtagc caacgctatg 
ccacagtcga tgaatccaga aaagcggcca 
tcgccatggg tcacgacgag atcctcgccg 
agttcggctg gcgcgagccc ctgatgctct 
gcttccatcc gagtacgtgc tcgctcgatg 
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taaagaaata 


gcgccactca gcttcctcag 8100 


ggcatagttc 


tcaagatcga cagcctgtca 


8160 


ataattcgga 


tctctgcgag ggagatgata 


8220 


gttacaatca 


acatgctacc ctccgcgaga 


8280 


tgccgttctt 


ccgaatagca tcggtaacat 


8340 


cocgctgacg 


ccgtcccgga ctgatgggct 


8400 


ctgccggtcg 


gggagctgtt ggctggctgg 


8460 


gacgcttaga 


caacttaata acacattgcg 8520 


ttttcaccag 


tgagacgggc aacagctgat 


8580 


gcagcaagcg 


gtccacgctg gtttgcccca 8640 


cgaaatcggc 


aaaatccctt ataaatcaaa 


8700 


tccagtttgg 


aacaagagtc cactattaaa- 


8760 


aaccgtctat 


cagggcgatg gcccactacg 


8820 


gtcgaggtgc 


cgtaaagcac taaatcggaa 


8880 


acggggaaag 


ccggcgaacg tggcgagaaa 


8940 


cattcaggct 


crccrcaactcffc tcrcrcraacrcrcrc 


9000 


agctggcgaa 


agggggatgt gctgcaaggc 


9060 


agtcacgacg 


ttgtaaaacg acggccagtg 


9120 


ttaaatattt 


attgataaaa taacaagtca 


9180 


tattgatgca 


agtttaaatt cagaaatatt 


.9240 


gccgtagatg 


aaagactgag tgcgatatta 


9300 


gcttagctca 


tcgggggatc cgtcgaagct 


9360 


agaaggcgat 


agaaggcgat gcgctgcgaa 


9420 


aagcggtcag 


cccattcgcc gccaagctct 


9480 


tcctgatagc 


ggtccgccac acccagccgg 


9540 


ttttccacca 


tgatattcgg caagcaggca 


9600 


tcgggcatgc 


gcgccttgag cctggcgaac 


9660 


tcgtccagat 


catcctgatc gacaagaccg 


9720 


cgatgtttcg 


cttggtggtc gaatgggcag 


9780 
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gtagccggat caagcgtatg cagccgccgc attgcatcag ccatgatgga tactttctcg 9840 
gcaggagcaa ggtgagatga caggagatcc tgccccggca cttcgcccaa tagcagccag 9900 
tcccttcccg cttcagtgac aacgtcgagc acagctgcgc aaggaacgcc cgtcgtggcc 9960 
agccacgata gccgcgctgc ctcgtcctgc agttcattca gggcaccgga caggtcggtc 10020 
ttgacaaaaa gaaccgggcg cccctgcgct gacagccgga acacggcggc atcagagcag 10080 
ccgattgtct gttgtgccca gtcatagccg aatagcctct ccacccaagc ggccggagaa 10140 
cctgcgtgca atccatcttg ttcaatccaa gcteccatgg gccctcgact agagtcgaga 10200 
tctggattga gagtgaatat gagactctaa ttggataccg aggggaattt atggaacgtc 10260 
agtggagcat ttttgacaag aaatatttgc tagctgatag tgaccttagg cgacttttga 10320 
acgcgcaata atggtttctg acgtatgtgc ttagctcatt aaactccaga aacccgcggc 10380 
tgagtggctc cttcaacgtt gcggttctgt cagttccaaa cgtaaaacgg cttgtcccgc 10440 
gtcatcggcg ggggtcataa cgtgactccc ttaattctcc gctcatgatc ttgatcccct 10500 
gcgccatcag atccttggcg gcaagaaagc catccagttt actttgcagg gcttcccaac 10560 
cttaccagag ggcgccccag ctggcaattc cggttcgctt gctgtccata aaaccgccca 10620 
gtctagctat cgccatgtaa gcccactgca agctacctgc tttctctttg cgcttgcgtt 10680 
ttccctt'gtc cagatagccc agtagctgac attcatccgg ggtcagcacc gtttctgcgg 10740 
actggctttc tacgtgttcc gcttccttta gcagcccttg cgccctgagt gcttgcggca 10800 
gcgtgaagct tgcatgcctg caggtcgacg gcgcgccgag ctcctcgagc aaatttacac 10860 
attgccacta aacgtctaaa cccttgtaat ttgtttttgt tttac.tatgt gtgttatgta 10920 
tttgatttgc gataaatttt tatatttggt actaaattta taacaccttt tatgctaacg 10980 
tttgccaaca cttagcaatt tgcaagttga ttaattgatt ctaaattatt tttgtcttct 11040 
aaatacatat actaatcaac tggaaatgta aatatttgct aatatttcta ctataggaga 11100 
attaaagtga gtgaatatgg taccacaagg tttggagatt taattgttgc aatgctgcat 11160 
ggatggcata tacaccaaac attca^ataat tcttgaggat aataatggta ccacacaaga 11220 
tttgaggtgc atgaacgtca cgtggacaaa aggtttagta atttttcaag acaacaatgt 11280 
taccacacac aagttttgag gtgcatgcat ggatgccctg tggaaagttt aaaaatattt 11340" 
tggaaatgat ttgcatggaa gccatgtgta aaaccatgac atccacttgg aggatgcaat 11400 
aatgaagaaa actacaaatt tacatgcaac tagttatgca tgtagtctat ataatgagga 11460 
ttttgcaata ctttcattca tacacactca ctaagtttta cacgattata atttcttcat 11520 



9 
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agccagccca ccgcggtgga aa atg gag gtc gtg gag aga ttc tac ggt gag 11572 

Met Glu Val Val Glu Arg Phe Tyr Gly Glu 
15 10 

ttg gat ggg aag gtc teg cag ggc gtg aat gca ttg ctg ggt agt ttt 11620 
Leu Asp Gly Lys Val Ser Gin Gly Val Asn Ala Leu Leu Gly Ser Phe 
15 20 25 

ggg gtg gag ttg acg gat acg ccc act acc aaa ggc ttg ccc etc gtt . 11668 
Gly Val ciu Leu Thr Asp Thr Pro Thr Thr Lys Gly Leu. Pro Leu Val 
30 • 35 40 

gac agt ecc aca ccc ate gtc etc ggt gtt tct gta tac ttg act att 11716 
Asp Ser Pro Thr Pro lie Val Leu Gly Val Ser Val Tyr Leu Thr He 
45 50 55 

gtc att gga ggg ctt ttg tgg ata aag gcc agg gat ctg aaa ccg cgc 11764 
Val He Gly Gly Leu Leu Trp He Lys' Ala Arg Asp Leu Lys Pro Arg 
60 65 70 

gcc teg gag cea ttt ttg etc caa get ttg gtg- ctt gtg cac aac ctg . 11812 
Ala Ser Glu Pro Phe Leu Leu Gin Ala Leu Val Leu Val His Asn Leu 
75 80 85 90 

ttc tgt ttt gcg etc agt ctg tat atg tgc gtg ggc ate get tat cag* 11860 
Phe Cys Phe Ala Leu Ser Leu Tyr Met Cys Val Gly He Ala Tyr Gin 
95 .100 105 

get att acc tgg egg tac tct etc tgg ggc aat gca tac aat cet aaa 11908 
Ala He Thr Trp Arg Tyr Ser Leu Trp. Gly Asn Ala Tyr Asn Pro Lys 
110 115 120 

cat aaa gag atg gcg att ctg gta tac ttg ttc tac atg tct aag tac 11956 
His Lys - Glu Met Ala He Leu Val Tyr Leu Phe Tyr Met Ser Lys Tyr . . 

125 ' 130 135 • . I 

gtg gaa ttc atg gat acc gtt ate atg ata ctg aag cgc age acc agg' .'-12004 
Val Glu Phe Met Asp Thr Val He Met He Leu Lys Arg Ser Thr Arg 
140 145 . 150 

caa ata age ttc etc cac gtt tat cat cat tct tea att tec etc att 12052 
Gin He Ser Phe Leu His Val Tyr His His Ser Ser He Ser Leu He 

155 - 160 165 170 

I i 

tgg tgg get att get cat cac get cet ggc ggt gaa gca tat tgg tct 12100 
Trp Trp Ala He Ala His His Ala Pro Gly Gly Glu Ala Tyr Trp Ser 
175 180 185 

gcg get ctg aac tea gga gtg eat gtt etc atg tat gcg tat tac ttc 12148 
Ala Ala Leu Asn Ser Gly Val His Val Leu Met Tyr Ala Tyr Tyr Phe 
190 195 200 

ttg get gee tgc ctt ega agt age cea aag tta aaa aat aag tac ctt 1219 B 
Leu Ala Ala Cys Leu Arg Ser Ser Pro Lys Leu Lys Asn Lys Tyr Leu- 
205 210 215 

ttt tgg ggc agg tac ttg aca caa ttc caa atg ttc cag ttt atg ctg 12244 
Phe Trp Gly Arg Tyr Leu Thr Gin Phe Gin Met Phe Gin Phe Met Leu 
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220 225 230 

aac tta gtg cag get tac tac gac atg aaa acg aat gcg cca tat cca 12292 
Asn Leu Val Gin Ala Tyr Tyr Asp Met I^ys Thr Asn Ala Pro Tyr Pro 
235 240 245 250 



caa tgg ctg ate aag att ttg ttc tac tac atg ate teg ttg ctg ttt 
Gin Trp Leu lie Lys He Leu Phe Tyr Tyx Met He Ser Leu Leu Phe 
255 260 265 

ctt tte ggc aat ttt tac gta caa aaa tac ate aaa ccc tet gac gga 
Leu Phe Gly Asn Phe Tyr Val Gin Lys Tyr He Lys Pro Ser Asp Gly 
270 275 . . 280 



12340 



12388 



aag caa aag gga get aaa act gag tga tctagaaggc ctcctgettt 12435 
Lys Gin Lys Gly Ala Lys Thr Glu 
285 290 



aatgagatat 


gcgagacgcc 


tatgatcgea 


tgatatttgc 


cnccaacucc 


guuy uycacg 




ttgtaaaaaa 


cctgagcatg 


tgtagcteag 


atccttaccg • 


ccggtttcgg 


uccauucuaa 




CLCl UCL L*a> \^\^ 


aecegttact 


atcgtatttt 


tatgaataat 


attctccgtt 


caatttactg 


12615 


attgtcegtc 


gagcaaattt 


acacattgce 


actaaaegtc 


taaacccttg 


taatttgttt 


12675 


ttgttttact 


atgtgtgtta 


tgtatttgat 


ttgcgataaa 


tttttatatt 


tggtactaaa 


12735 


tttataacac 


cttttatget 


aacgtttgce 


aacacttagc 


aatttgcaag 


ttgattaatt 


12795 


gattctaaat 


tatttttgtc 


ttctaaatac 


atataetaat 


ceiactggaaa 


tgtaaatatt 


12855 


tgctaatatt 


tctactatag 


gagaattaaa 


gtgagtgaat 


atggtaccac 


aaggtttgga 


12915 


gatttaattg 


ttgeaatget 


gcatggatgg 


eatatacacc 


aaaeattcaa 


taattcttga 


12975 


ggataataat 


ggtaccacac 


aagatttgag 


gtgeatgaac 


gtcacgtgga 


cciaaaggttt 


13035 


agtaattttt 


caagacaaca atgttaccac 


acacaagttt 


tgaggtgcat 


gcatggatgc 


13095 


cctgtggaaa 


gtttaaaaat attttggaaa 


tgatttgeat 


ggaagccatg 


tgtaaaacca 


13155 


tgacatccac 


ttggaggatg caataatgaa 


gaaaactaca 


aatttacatg 


caactagtta 


13215 


tgcatgtagt 


ctatataatg aggattttgc 


aatactttca 


tteatacaca 


ctcactaagt 


13275 


tttacaegat 


tataatttct 


tcatagccag 


cggatcc atg gta ttc gcg ggc ggt 
Met Val Phe Ala Gly Gly 


13330 
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gga ctt cag cag ggc tct etc gaa gaa aac ate gac gte gag cac att 13378 
Gly Leu Gin Gin Gly Ser Leu Glu Glu Asn He Asp Val Glu His He 
300 305 310 

gee agt atg tct etc ttc age gac ttc tte agt tat gtg tct tea act 13426 
Ala Ser Met Ser Leu Phe Ser Asp Phe Phe Ser Tyr Val Ser Ser Thr 
315 320 325 
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gtt ggt teg tgg age gta cae agt ata eaa cct ttg aag cgc ctg acg 13474 
Val Gly Ser Trp Ser Val His Ser lie Gin Pro Leu Lys Arg Leu Thr 
330 335 340 345 

agt aag aag cgt gtt teg gaa age get gee gtg eaa tgt ata tea get 13522 
Ser Lys Lys Arg Val Ser Glu Ser Ala Ala Val Gin Cys He Ser Ala 
350 355 360 

gaa gtt eag aga aat teg agt aee eag gga aet gcg gag gea etc gca 13570 
Glu Val Gin Arg Asn Ser Ser Thr Gin Gly Thr Ala Glu Ala Leu Ala 
365 370 375 

gaa tea gtc gtg aag eee aeg aga cga agg tea tct eag tgg aag aag 13618 
Glu Ser Val Val Lys Pro Thr Arg Arg Arg Ser Ser Gin Trp Lys Lys 
380 385 ■ 390 

teg aca eae cce eta tea gaa gta gea gta cac aac aag cea age gat 13666 
Ser Thr His Pro Leu Ser Glu Val Ala Val His Asn Lys Pro Ser Asp 
395 400 405 

tge tgg att gtt gta aaa aac aag gtg tat gat gtt tec aat ttt geg 13714 
Cys Trp He Val Val Lys Asn Lys Val Tyr Asp Val Ser Asn Phe Ala 
410- 415 420 425 

gac gag cat cce gga gga tea gtt att agt aet tat ttt gga cga gac 13762 
Asp Glu His Prx3 Gly Gly Ser Val He Ser Thr Tyr Phe Gly Arg Asp 
430 435 440 



ggc aca gat gtt ttc tct agt ttt cat gea get tct aca tgg aaa att 
Gly Thr Asp Val Phe Ser Ser Phe His Ala Ala Ser Thr Trp Lys He 
445 450 , . 455 



aat gtt get att ttt get geg age att gca ata ata tgt tgg age aag 
Asn Val Ala He Phe Ala Ala Ser He Ala He He Cys Trp Ser Lys 
510 515 520 



eaa eag tgc gga tgg eta tee cat gat ttt etc eae aat eag gtg ttt 
Gin <3ln Cys Gly Trp Leu Ser His Asp Phe Leu His Asn Gin Val Phe 
540 545 550 



13810 



dtt eaa gac ttt tac att ggt gap gtg gag agg gtg gag ceg aet cea 13858 
Leu Gin Asp Phe Tyr He Gly Asp Val Glu Arg Val Glu Pro Thr Pro 
460 465 470 

gag'etg ctg aaa gat ttc cga gaa atg aga get ctt ttc ctg agg gag 13906 
Glu Leu Leu Lys Asp Phe Arg Glu Met Arg Ala Leu Phe Leu Arg Glu • 
475 480 485 

eaa ctt ttc aaa agt teg aaa ttg tac tat gtt atg aag ctg etc acg 13954 
Gin Leu Phe Lys Ser Ser Lys Leu Tyr Tyr Val Met Lys Leu Leu Thr 
490 495 500 505 



14002 



act att tea gcg gtt ttg get tea get tgt atg atg get ctg tgt ttc 14050 
Thr He Ser Ala Val Leu Ala Ser Ala Cys Met Met Ala Leu Cys Phe 
525 530 535 



14098 



gag aca cgc tgg ctt aat gaa gtt gtc ggg tat gtg ate ggc aac gee 14146 
Glu Thr Arg Trp Leu Asn Glu Val Val Gly Tyr Val He Gly Asn Ala 
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555 560 565- 

gtt ctg ggg ttt agt aca ggg tgg tgg aag gag aag cat aac ctt cat 14194 
Val Leu Gly Phe Ser Thr Gly Trp Tarp Lys Glu Lys His Asn Leu His 
570 575 580 585 

cat get get cca aat gaa tgc gat cag act tac caa cca att gat gaa 14242 
His Ala Ala Pro Asn Glu Cys Asp Gin Thr Tyr Gin Pro He Asp Glu 
590 595 600 



gat att gat act etc ccc etc att gee tgg age aag gae ata ctg gee 14290 
Asp He Asp Thr Leu Pro Leu He Ala Trp Ser Lys Asp He Leu Ala 
605 610 r 615 

aca gtt gag aat aag aca ttc ttg cga ate etc caa tac cag cat ctg 14338 
Thr Val Glu Asn Lys Thr Phe Leu Arg He Leu Gin Tyr Gin His Leu . 
620 625 630 

ttc ttc atg ggt ctg tta ttt ttc gee cgt ggt agt tgg etc ttt tgg 14386 
Phe Phe Met Gly Leu Leu Phe Phe Ala Arg Gly Ser Trp Leu Phe' Trp 
635 640 645 

age tgg aga tat acc tct aca gca gtg etc tea cct gte gac agg ttg 14434 
Ser Trp Arg Tyr Thr Ser Thr Ala Val Leu Ser Pro Val Asp Arg Leu 
650 655 660 665 

ttg gag aag gga act gtt ctg ttt cac tac ttt tgg ttc gte ggg aca 14482 
Leu Glu Lys Gly Thr Val Leu Phe His Tyr Phe Trp Phe Val Gly Thr 
670 675 680 

gcg tgc tat ctt etc cct ggt tgg aag cca tta gta tgg atg geg gtg 14530 
Ala Cys Tyr Leu Leu Pro Gly Trp Lys Pro Leu Val Trp Met Ala Val 
685 690 695 

act gag etc atg tec ggc atg ctg ctg ggc ttt gta ttt gta ctt age 14578 
Thr Glu Leu Met Ser Gly Met Leu Leu Gly Phe Val Phe Val Leu Ser 
■700 705 710 

cac aat ggg atg gag gtt tat aat teg tct aaa gaa ttc gtg agt gca -.14626 
His Asn Gly Met Glu Val Tyr Asn Ser Ser Lys Glu Phe Val Ser Ala 
715 720 725 

cag ate gta tec aca egg gat ate aaa gga aac ata ttc aac gac tgg 14674 
Gin He Val Ser Thr Arg Asp He Lys Gly Asn He Phe Asn Asp Trp 
730 735 740 745 

ttc act ggt ggc ctt aac agg caa ata gag cat cat ctt ttc cca aca 14722 
Phe Thr Gly Gly Leu Asn Arg Gin He Glu His His Leu Phe Pro Thr 
750 755 760 

atg ccc agg cat aat tta aac aaa ata gca cct aga gtg gag gtg ttc 14770 
Met Pro Arg His Asn teu Asn Lys He Ala Pro Arg Val Glu Val Phe 
765 770 775 

tgt aag aaa cac ggt ctg gtg tac gaa gac gta tct att get acc ggc 14818 
Cys Lys Lys His Gly Leu Val Tyr Glu Asp Val Ser He Ala Thr Gly 
780 785 • 790 
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act tgc aag gtt ttg aaa gca ttg aag gaa gtc gcg gag get gcg gca 14866 
lOir Cys Lys Val Leu Lys Ala Leu Lys Glu Val Ala Glu Ala Ala Ala 
795 800 805 

gag cag cat get acc acc agt taa gctagcgtta accctgcttt aatgagatat 14920 
Glu Gin His Ala Thr Thr Ser 
810 815 



gcgagacgcc tatgatcgca 


cgauacucgc 


u c u caa u u w u 


rr t* t" rr t* rr r* a r* cr 


fc tcr taaaaaa 


14980 


cctgagcatg . tgtagctcag 


atccttaccg 


ccgguuucgg 


UUwau UCLCL 




15040 


acccgttact atcgtatttt 


ca cgaacaac 


acuCtccguu 




ahtcrtcccftc 


15100 


gagcaaattt acacattgcc 


actaaacgtc 


taaacccttg 


caacuuguuu 


t-trrl-l-t-har't 


15160 


atgtgtgtta tgtatttgat 


ttgcgataaa 


tttttatatt 


cggcacuaaa 


♦"4" ♦"a ^aa/^ar* 


15220 


cttttatgct aacgtttgcc 


aacacttagc 


aatttgcaag 


ccgaucaauu 


^a ♦•^^aa a t* 
y a u u^ir uaacL u 


15280 


tatttttgtc ttctaaatac 


atataccaat 


caactggaaa 


1" rrl" a a t* 




15340 


tctactatag gagaattaaa 


gtgagtgaat 


atggtaccac 


aaggtttgga 


gatttaattg 


15400 


ttgcaatgct gcatggatgg 


catatacacc 


aaacattcaa 


taattcttga 


ggataataat 


15460 


ggtaccacac aagatttgag 


gtgcatgaac 


gtcacgtgga 


caaaaggttt 


agtaattttt 


15520 


caagacaaca atgttaccac 


acacaagttt 


tgaggtgcat 


gcatggatgc 


cctgtggaaa 


15580 


gtttaaaaat attttggaaa 


tgatttgcat 


ggaagccatg 


tgtaaaacca 


tgacatccac 


15640 


ttggaggatg caataatgaa 


gaaaactaca 


aatttacatg 


caactagtta 


. tgcatgtagt 


15700 


ctatataatg aggattttgc 


. aatactttca 


ttcatacaca 


ctcactaagt 


tttacacgat 


15760 


tataatttct tcatagccag 


cagatctaaa 


atg get ccg gat gcg gat aag ctt 
Met Ala Pro Asp Ala Asp Lys Leu 


15814 



820 825 

cga eaa egc cag aeg act gcg gta gcg aag cac aat get get ace ata 15862 
Arg Gin Arg Gin Thr Thr Ala Val- Ala Lys His Asn Ala Ala Thr lie 
830 835 840 

teg aeg cag gaa cgc ctt tgc agt ctg tet teg etc aaa gge gaa gaa 15910 
Ser Thr Gin Glu Arg Leu Cys Ser Leu Ser Ser Leu Lys 'Gly Glu Glu' 
845 850 855 

gtc tgc ate gac gga ate ate tat gae etc eaa "tea tte gat cat cec 15958 
Val Cys He Asp Gly He He Tyr Asp Leu Gin Ser Phe Asp His Pro 
860 865 '870 

ggg ggt gaa aeg ate aaa atg ttt ggt gge aac gat gtc act gta cag 16006 
Gly Gly Glu Thr He Lys Met Phe Gly Gly Asn Asp Val Thr Val Gin 
875 880 885 

tae aag atg att cac ccg tae cat ace gag aag cat ttg gaa aag atg 16054 
Tyr Lys Met He His Pro Tyr His Thr Glu Lys His Leu Glu Lys Met 



890 



895 
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900 



905 



aag cgt gtc ggc aag gtg acg gat ttc gtc tgc gag tac aag ttc gat 
Lys Arg Val Gly Lys Val Thr Asp Phe Val Cys Glu Tyr Lys Phe Asp 
910 915 920 



16102 



acc gaa ttt gaa cgc gaa ate aaa cga gaa gtc ttc aag att gtg cga 
Thr Glu Phe Glu Arg Glu lie Lys Arg Glu Val Phe Lys lie Val Arg 
■ 925 930 935 



16150 



cga ggc aag gat ttc ggt act ttg gga tgg ttc ttc cgt gcg ttt tgc 
Arg Gly Lys Asp Phe Gly Thr Leu Gly Trp Phe Phe Arg Ala Phe Cys 
940 945 950 



16198 



tac att gcc att ttc ttc tac ctg cag tac cat tgg gtc acc acg gga 
Tyr He Ala He Phe Phe Tyr peu Gin Tyr His Trp Val Thr Thr Gly 
955 960 965 



16246 



acc tct tgg ctg ctg gcc gtg gcc tac gga ate tec caa gcg atg att 
Thr Ser Trp Leu Leu Ala Val Ala Tyr Gly He Ser Gin Ala Met He 
970 975 980 985 



16294 



ggc atg aat gtc cag cac .gat gcc aac cac ggg gcc acc tec aag cgt 
Gly Met Asn Val Gin His Asp Ala Asn His Gly Ala Thr Ser Lys Arg 
990 995 1000 



16342 



ccc tgg gtc aac gac atg eta ggc etc ggt gcg gat ttt att ggt ggt 
Pro Trp Val Asn Asp Met Leu Gly Leu Gly Ala Asp Phe He Gly Gly' 
1005 1010 1015 ' 



16390 



tec aag tgg etc tgg cag gaa caa cac tgg acc cac cac - get tac acc 
Ser Lys Trp Leu Trp Gin Glu Gin His Trp Thr His His Ala Tyr Thr 
1020 1025 . 1030 



16438 



aat cac gcc gag atg gat ccc gat age ttt ggt gcc gaa cea atg etc 
Asn His Ala Glu Met Asp Pro Asp Ser Phe Gly Ala Glu Pro Met Leu 
1035 1040 1045 



16486 



eta ttc aac gac tat ccc ttg gat. eat ccc get cgt acc tgg eta cat 
Leu Phe Asn Asp Tyr Pro Leu Asp His Pro Ala Arg Thr Trp Leu His 
1050 1055 1060 1065 



16534 



cgc ttt caa gca ttc ttt tac atg ccc gtc ttg get gga tac tgg ttg 
Arg Phe Gin Ala Phe Phe Tyr Met Pro Val Leu Ala Gly Tyr Trp Leu 
1070 1075 1080 



16582 



tec get gtc ttc aat cca caa att ctt gac etc cag caa cgc ggc gca 
Ser Ala Val Phe Asn Pro Gin He Leu Asp Leu Gin Gin Arg Gly Ala 
1085 1090 1095 



16630 



ctt tec gtc ggt ate cgt etc gac aac get ttc att cac teg cga cgc 
Leu Ser Val Gly He Arg Leu Asp Asn Ala Phe He His Ser Arg Arg 
1100 1105 ■ 1110 



16678 



aag tat gcg gtt ttc tgg egg get gtg tac att gcg gtg aac gtg att 
Lys Tyr Ala Val Phe Trp Arg Ala Val Tyr He Ala Val Asn Val He 
1115 1120 1125 



16726 
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get ccg ttt tac aca aac tec ggc etc gaa tgg tcc tgg cgt gtc ttt 
Ala Pro Phe Tyr Thr Asn Sex Gly Leu Glu Trp Ser Trp Arg Val Phe 
1130 1135 1140 1145 

gga aac ate atg etc atg ggt gtg gcg gaa teg . etc geg ctg geg gte 
Gly 'Asn lie Met Leu Met Gly Val Ala Glu Ser Leu Ala Leu Ala Val 
1150 1155 1160 

ctg ttt teg ttg teg cae aat ttc gaa tee gcg gat egc gat ccg ace 
Leu Phe Ser Leu Ser His Asn Phe Glu Ser Ala Asp Arg Asp Pro Thr 
1165 1170 • 1175 



16774 



16822 



16870 



gee eca ctg aaa aag aeg gga gaa cca gte gae tgg ttc aag aca cag 
Ala Pro Leu Lys Lys Thr Gly Glu Pro Val Asp Trp Phe Lys Thr Gin 
1180 1185 1190 

gtc gaa act tec tgc act tac ggt gga ttc ett tec ggt tgc ttc aeg 
Val Glu Thr Ser Cys Thr Tyr Gly Gly Phe Leu Ser Gly Cys Phe Thr 
1195 1200 1205 

gga ggt etc aac ttt cag gtt gaa cae cac ttg ttc cca egc atg. age 
Gly Gly Leu Asii Phe Gin Val Glu His His Leu Phe Pro Arg Met Ser 
1210 1215 1220 1225 

age get tgg tat cec tac att gee cec aag gte egc gaa att tgc gee 
Ser Ala Trp Tyr Pro Tyr lie Ala Pro Lys Val Arg Glu He Cys Ala 
1230 1235 1240 



16918 



16966- 



17014 



17062 



aaa cae ggc gte cac tac gee tac tac ccg tgg ate cae caa aac ttt 
Lys His Gly Val His Tyr Ala Tyr Tyr Pro Trp He His Gin Asn Phe 
1245 1250 1255 



17110 



etc tee ace gte egc tac atg cac gcg gee ggg ace ggt gcc aac tgg 17158 
Leu Ser Thr Val Arg Tyr Met His Ala Ala Gly Thr Gly Ala Asn Trp 
1260 1265 1270 

egc cag atg gee aga gaa aat cec ttg ace gga egg gcg taa 17200 
Arg Gin Met Ala Arg Glu Asn Pro Leu Thr Gly Arg Ala 



1275 




1280 


1285 






agatctgecg 


geatcgatec 


egggceatgg 


ectgetttaa 


tgagatatgc 


gagaegceta 


17-260 


tgatcgcatg 


atatttgctt 


teaattctgt 


tgtgcacgtt 


gtaaaaaacc 


tgagcatgtg 


17320 


tagcteagat 


ccttaecgec 


ggtttcggtt 


eattctaatg 


aatatatcae 


ccgttaetat 


17380 


egtattttta 


tgaataatat 


tctecgttca 


atttactgat 


tgtccgtcga 


cgagctcgge 


17440 


gegcetctag 


aggatcgatg 


aatteagate 


ggctgagtgg 


etcetteaac 


gttgcggttc 


17500 


tgtcagttcc 


aaaegtaaaa 


eggettgtce 


cgegtcateg 


gegggggtca 


taaegtgaet 


17560 


cecttaatte 


tccgctcatg 


atcagattgt 


cgttteccgc 


ettcagttta 


aactatcagt 


17620 


gtttgacagg 


atatattgge 


gggtaaaect 


aagagaaaag 


agcgtttatt 


agaataateg 17680 


gatatttaaa 


agggegtgaa 


aaggtttatc 


cttegtccat 


ttgtatgtge 


atgecaacca 


17740 
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cagggttccc ca 17752 



<210> 29 
<211> 290 . 
<212> PRT 
<213> Unknown 

<400> 29 

Met Glu Val Val Glu Arg Phe Tyr Gly Glu Leu Asp Gly Lys Val Ser 
1 5 10 . 15 

Gin Gly Val Asn Ala Leu Leu Gly Ser Phe Gly Val Glu Leu Thr Asp 
20 .25 30 

Thr Pro Thr Thr Lys Gly Leu Pro Leu Val Asp Ser Pro Thr Pro lie 
35 40 45 • 

Val Leu Gly Val Ser Val Tyr Leu Thr He Val He Gly Gly Leu Leu 
50 55 60 • 

Trp He Lys Ala Arg Asp Leu Lys Pro Arg Ala Ser Glu Pro Phe Leu 
65 70 . 75 . 80 

Leu Gin Ala Leu .Val Leu Val His Asn Leu Phe Cys Phe Ala Leu Ser 
85 90. . 95 

Leu Tyr Met Cys Val Gly He Ala Tyr Gin Ala He Thr Trp Arg Tyr 
100 105 110 

Ser Leu Trp Gly Asn Ala Tyr Asn Pro Lys His Lys Glu Met Ala He 
115 120 125 

Leu Val Tyr Leu Phe Tyr Met Ser Lys Tyr Val Glu Phe Met Asp Thr 
130 .135 140 

Val He Met He Leu Lys Arg Ser Thr Arg Gin He Ser Phe Leu His 
145 150 * 155 160 

Val Tyr His His Ser Ser He Ser Leu He Trp Trp Ala. He Ala His 
165 170 175 

His Ala Pro Gly Gly Glu Ala Tyr Trp Ser Ala Ala Leu Asn Ser Gly 
180 185* 190 

Val His Val Leu Met Tyr Ala Tyr Tyr Phe Leu Ala Ala Cys Leu Arg 
195 . 200 205 

Ser Ser Pro Lys Leu Lys Asn Lys Tyr Leu Phe Trp Gly Arg Tyr Leu 
210 215 220 

Thr Gin Phe Gin Met Phe Gin Phe Met Leu Asn Leu Val Gin Ala Tyr 
225 230 235 240 

Tyr Asp Met Lys Thr Asn Ala Pro Tyr Pro Gin Trp Leu He Lys He 
245 250 255 



Leu Phe Tyr Tyr Met He Ser Leu Leu Phe Leu Phe Gly Asn Phe Tyr 
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260 



265 



270 



Val Gin Lys Tyr lie Lys Pro Ser Asp Gly Lys Gin Lys Gly Ala Lys 
275 280 285 



Thr Glu 
290 



<210> 30 
<211> 525 
<212> PRT 
<213> Unknown 

<400> 30 

Met Val Phe Ala Gly Gly Gly Leu Gin Gin Gly Ser Leu Glu Glu Asn 
1 5 . . 10 15 

He Asp Val Glu His He Ala Ser Met Ser Leu Phe Ser Asp Phe Phe 
20 25* 30 

Ser Tyr Val Ser Ser Thr Val Gly Ser Trp Ser Val His Ser He Gin 
35 .40 45 . 

Pro Leu Lys Arg Leu Thr Ser Lys Lys Arg Val Ser Glu Ser Ala Ala 
50 55 60 

Val Gin Cys He Ser Ala Glu Val Gin Arg Asn Ser Ser Thr Gin Gly 
65 .70 75 i s 80 

Thr Ala Glu Ala Leu Ala Glu Ser Val Val Lys Pro Thr Arg Arg Arg 
85 90 . ' j 95 • 

Ser Ser Gin Trp Lys Lys Ser Thr His Pro Leu Ser Glu Val Ala Val 
100 • 105 110 

His Asn Lys Pro Ser Asp Cys Trp He Val Val Lys Asn Lys Val Tyr 
115 . 120 125 

Asp Val Ser Asn Phe Ala Asp Glu His Pro Gly Gly Ser Val He Ser 
130 135 140 

Thr Tyr Phe Gly Arg Asp Gly Thr Asp Val Phe Ser Ser Phe His Ala 
145 150 155 160 

Ala Ser Thr Trp Lys He Leu Gin Asp Phe Tyr He Gly Asp Val Glu 
165 170 175 

Arg Val Glu Pro Thr Pro Glu Leu Leu Lys Asp Phe Arg Glu Met Arg 
180 • 185 190 

Ala Leu Phe Leu Arg Glu Gin Leu Phe Lys Ser Ser Lys Leu Tyr Tyr 
195 200 205 • 

Val Met Lys Leu Leu Thr Asn Val Ala He Phe Ala Ala Ser He Ala 
210 215 220 

He He Cys Trp Ser Lys Thr He Ser Ala Val Leu Ala Ser Ala Cys 



225 



230 
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235 



240 



Met Met Ala Leu Cys Plie Gin Gin Cys Gly Trp Leu Ser His Asp Phe 
245 250 255 

Leu His Asn Gin Val Phe Glu Thr Arg Trp Leu Asn Glu Val Val Gly 
260 265 270 

Tyr Val lie Gly Asn Ala Val Leu Gly Phe Ser Thr Gly Trp Trp Lys 
275 280 285 

Glu Lys His Asn Leu His His Ala Ala Pro Asn Glu Cys Asp Gin Thr 
290 295 300 

Tyr Gin Pro lie Asp Glu Asp lie Asp Thr Leu .Pro Leu lie Ala Trp 
305 310 315 320 

Ser Lys Asp lie Leu Ala Thr Val Glu Asn Lys Thr Phe Leu Arg lie 
325 33,0 335 

Leu Gin Tyr Gin His Leu Phe Phe Met Gly Leu Leu Phe Phe Ala Arg 
340 345 350 

Gly Ser Trp Leu Phe Trp Ser Trp Arg Tyr Thr Ser Thr Ala Val Leu 
355 360 365 

Ser Pro Val Asp Arg Leu Leu Glu Lys Gly Thr Val Leu Phe His Tyr 
370 375 380 

Phe Trp Phe Val Gly Thr Ala Cys Tyr Leu Leu Pro Gly Trp Lys Pro 
385 390 395 400 

Leu Val Trp Met Ala Val Thr Glu Leu Met Ser Gly Met Leu Leu Gly 
405 410 415 

Phe Val Phe Val Leu Ser His Asn Gly Met Glu Val Tyr Asn Ser Ser 
420 425 430 

Lys Glu Phe Val Ser Ala Gin lie Val. Ser Thr Arg Asp lie Lys Gly 
435 440 445 

Asn lie Phe Asn Asp Trp Phe Thr Gly Gly Leu Asn Arg Gin lie Glu 
450 455. 460 

His His Leu Phe Pro Thr Met Pro Arg His Asn Leu Asn Lys He Ala 
465 470 475 480 

Pro Arg Val Glu Val Phe Cys Lys Lys His Gly Leu Val Tyr Glu Asp 
485 490 495 

Val Ser He Ala Thr Gly Thr Cys Lys Val Leu Lys Ala Leu Lys Glu 
500 505 510 

Val Ala Glu Ala Ala Ala Glu Gin His Ala Thr Thr Ser 
515 520 525 



<210> 31 
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<211> 469 
<212> PRT 
<213> Unknown 

<400> 31 

Met Ala Pro Asp Ala Asp Lys Leu Arg Gin Arg Gin Thr Thr Ala Val 
1 5 10 15 

Ala Lys His Asn Ala Ala Thx lie Ser Thr Gin Glu Arg Leu Cys Ser 
20 25 30 

Leu Ser Ser Leu Lys Gly Glu Glu Val Cys He Asp Gly He He Tyr 

35 '40 45 .' . . 

Asp Leu Gin Ser Phe Asp His Pro Gly Gly Glu Thr He Lys Met Phe 
50 55 60 

Gly Gly Asn Asp Val Thr Val Gin Tyr Lys Met He His Pro Tyr His 
.65 70 75 80 

Thr Glu Lys His Leu Glu Lys Met Lys Arg Val Gly Lys Val Thr Asp 
85 90 95 

Phe Val Cys Glu Tyr Lys Phe Asp Thr Glu Phe Glu Arg Glu He Lys 
100 105 110 

Arg Glu Val Phe Lys He Val Arg Arg Gly Lys Asp Phe Gly Thr Leu 
115 120 125 

Gly Trp Phe Phe Arg Ala Phe Cys Tyr He Ala He Phe Phe Tyr Leu 
130 135 ' 140 

Glri Tyr His Trp Val Thr Thr Gly Thr. Ser Trp Leu Leu Ala Val Ala 
145 150 155 160 

Tyr Gly He Ser Gin Ala Met He Gly Met Asn Val Gin His Asp Ala 
165 170 175 

Asn His Gly Ala Thr Ser Lys Arg Pro Trp Val Asn Asp Met Leu Gly 
180 185 190 

Leu Gly Ala Asp Phe He Gly Gly Ser Lys Trp Leu Trp Gin Glu Gin 
195 200 205 

His Trp Thr His His Ala Tyr Thr Asn His Ala Glu Met Asp Pro Asp 
210 215 220 

Ser Phe Gly Ala Glu Pro Met' Leu Leu Phe Asn Asp Tyr Pro Leu Asp 
225 230 235 240 

His Pro Ala Arg Thr Trp Leu His Arg Phe Gin Ala Phe Phe Tyr Met 
245 250 255 

Pro Val Leu Ala Gly Tyr Trp Leu Ser Ala Val Phe Asn Pro Gin He 
260 265 270 

Leu Asp Leu Gin Gin Arg Gly Ala Leu Ser Val Gly He Arg Leu Asp 
275 280 285 
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Asn Ala Phe He His Ser Arg Arg Lys Tyr Ala Val Phe Trp Arg Ala 
290 295 300 

Val Tyr He Ala Val Asn Val He Ala Pro Phe Tyr Thr Asn Ser Gly 
305 310 315 320 * 

Leu Glu Trp Ser Trp Arg Val Phe Gly Asn He Met Leu Met Gly Val 
325 330 335 

Ala Glu Ser Leu Ala Leu Ala Val Leu Phe Ser Leu Ser His Asn Phe 
340 345 350 

Glu Ser Ala Asp Arg Asp Pro Thr Ala Pro Leu Lys Lys Thr Gly Glu 
355 360 365 

Pro Val Asp Trp Phe Lys Thr Gin Val Glu Thr Ser Cys Thr Tyr Gly 
370 375 380 

Gly Phe Leu Ser Gly Cys phe Thr Gly Gly Leu Asn Phe Gin Val Glu 
385 390 395. 400 

His His Leu Phe Pro Arg Met Ser Ser Ala Trp Tyr Pro Tyr He Ala 
405 410 415 

Pro Lys Val Arg Glu He Cys Ala Lys His Gly Val His Tyr Ala Tyr 
420 425 430 

Tyr Pro Trp He His Gin Asn Phe Leu Ser Thr Val Arg Tyr Met His 
435' 440 445 

Ala Ala^Gly Thr Gly Ala Asn Trp Arg Gin Met Ala Arg Glu Asn Pro 
450 455 460 

Leu Thr Gly Arg Ala 
465 . • 



<210> 32 
<211> 26 
<212> DNA 

<213> Artificial Sequence 

<220> 

<223> Poly linker 
<400> 32 

gaattcggcg cgccgagctc ctcgag 



<210> 33 
<211?> 265 
<212> DNA 

<213> Artificial Sequence 
<220> 

<223> Polylinker-Terminator-Polylinker 
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<400> 33 



aattcgagct cggcgcgcca agctt 



<210> 34 
<211> 257 
<212> DNA 

<213> Artificial Sequence 
<220> 

<223> Polylinker-Terminator-Polylinker 
<400> 34 



tgctttaatg 


agatatgcga 


60 


tgcacgttgt 


aaaaaacctg 


120 


ttctaatgaa 


tatatcaccc 


180 


ttactgattg 


tccgtcgacg 


240 






265 



ctcg&cgcgc caagctt 



<210> 35 
<211> 257 
'<212> DNA 

<213> Artificial Sequence 
<220> 

< 2 2 3 > PC lyl inker-Terminator-Polyl inker 
<400> 35 



tgagatatgc 


gagacgccta 


60 


gtaaaaaacc 


tgagcatgtg 


120 


aatatatcac 


ccgttactat 


180 


tgtccgtcga 


cgaattcgag 


240 






257 



ctcggcgcgc caagctt 



tgagatatgc 


gagacgccta 


60 


gtasiaaaacc 


tgagcatgtg 


120 


aatatatcac 


ccgttactat 


180 


tgtccgtcga 


cgaattcgag 


240 






257 



